Klassificeringsproblem

Den aktuelle version af siden er endnu ikke blevet gennemgået af erfarne bidragydere og kan afvige væsentligt fra den version , der blev gennemgået den 14. august 2019; checks kræver 6 redigeringer .

Klassificeringsopgaven  er en opgave, hvor der er mange objekter ( situationer ) opdelt på en eller anden måde i klasser . Der er givet et begrænset sæt af objekter, for hvilke det er kendt, hvilke klasser de tilhører. Dette sæt kaldes en prøve . Klassetilhørsforholdet for resten af ​​objekterne er ukendt. Det er nødvendigt at konstruere en algoritme , der er i stand til at klassificere (se nedenfor) et vilkårligt objekt fra det indledende sæt .

At klassificere et objekt betyder at angive nummeret (eller navnet) på den klasse, som det givne objekt tilhører.

Objektklassifikation - nummeret eller navnet på klassen, udstedt af klassifikationsalgoritmen som et resultat af dens anvendelse på dette bestemte objekt.

I matematisk statistik kaldes klassifikationsproblemer også for diskriminantanalyseproblemer . I maskinlæring løses klassifikationsproblemet, især ved hjælp af metoderne i kunstige neurale netværk, når man opretter et eksperiment i form af træning med en lærer .

Der er også andre måder at opsætte et eksperiment på - uovervåget læring , men de bruges til at løse en anden problemklynge eller taksonomi . I disse problemer er opdelingen af ​​træningsprøveobjekter ikke specificeret i klasser, og det kræves kun at klassificere objekter på grundlag af deres lighed med hinanden. På nogle anvendte områder, og endda i selve matematisk statistik, skelnes klyngeproblemer ofte ikke fra klassifikationsproblemer på grund af problemernes nærhed.

Nogle algoritmer til at løse klassifikationsproblemer kombinerer overvåget læring med uovervåget læring , for eksempel er en version af Kohonen neurale netværk  overvågede vektorkvantiseringsnetværk.

Matematisk sætning af problemet

Lad være et sæt af beskrivelser af objekter, være et sæt af tal (eller navne) af klasser. Der er en ukendt målafhængighed - kortlægning , hvis værdier kun kendes på objekterne i den endelige træningsprøve . Det er nødvendigt at bygge en algoritme , der er i stand til at klassificere et vilkårligt objekt .

Probabilistisk udsagn af problemet

Den sandsynlige redegørelse for problemet betragtes som mere generel. Det antages, at sættet af par "objekt, klasse" er et sandsynlighedsrum med et ukendt sandsynlighedsmål . Der er et begrænset træningssæt af observationer genereret i henhold til sandsynlighedsmålingen  . Det er nødvendigt at bygge en algoritme , der er i stand til at klassificere et vilkårligt objekt .  

Feature space

Et skilt er en kortlægning , hvor  er sættet af tilladte værdier for et skilt. Hvis træk er givet , kaldes vektoren en trækbeskrivelse af objektet . Vejledende beskrivelser kan identificeres med selve objekterne. I dette tilfælde kaldes sættet et feature space .

Afhængigt af sættet er skilte opdelt i følgende typer:

Ofte er der anvendte problemer med forskellige typer funktioner, ikke alle metoder er egnede til deres løsning.

Typologi af klassifikationsproblemer

Input datatyper

Klassificeringen af ​​signaler og billeder kaldes også for mønstergenkendelse .

Klassetyper

Se også

Links

Litteratur