Klassificeringsproblem

Den aktuelle version af siden er endnu ikke blevet gennemgået af erfarne bidragydere og kan afvige væsentligt fra den version , der blev gennemgået den 14. august 2019; checks kræver 6 redigeringer .

Klassificeringsopgaven er en opgave, hvor der er mange objekter ( situationer ) opdelt på en eller anden måde i klasser . Der er givet et begrænset sæt af objekter, for hvilke det er kendt, hvilke klasser de tilhører. Dette sæt kaldes en prøve . Klassetilhørsforholdet for resten af objekterne er ukendt. Det er nødvendigt at konstruere en algoritme , der er i stand til at klassificere (se nedenfor) et vilkårligt objekt fra det indledende sæt .

At klassificere et objekt betyder at angive nummeret (eller navnet) på den klasse, som det givne objekt tilhører.

Objektklassifikation - nummeret eller navnet på klassen, udstedt af klassifikationsalgoritmen som et resultat af dens anvendelse på dette bestemte objekt.

I matematisk statistik kaldes klassifikationsproblemer også for diskriminantanalyseproblemer . I maskinlæring løses klassifikationsproblemet, især ved hjælp af metoderne i kunstige neurale netværk, når man opretter et eksperiment i form af træning med en lærer .

Der er også andre måder at opsætte et eksperiment på - uovervåget læring , men de bruges til at løse en anden problemklynge eller taksonomi . I disse problemer er opdelingen af træningsprøveobjekter ikke specificeret i klasser, og det kræves kun at klassificere objekter på grundlag af deres lighed med hinanden. På nogle anvendte områder, og endda i selve matematisk statistik, skelnes klyngeproblemer ofte ikke fra klassifikationsproblemer på grund af problemernes nærhed.

Nogle algoritmer til at løse klassifikationsproblemer kombinerer overvåget læring med uovervåget læring , for eksempel er en version af Kohonen neurale netværk overvågede vektorkvantiseringsnetværk.

Matematisk sætning af problemet

Lad være et sæt af beskrivelser af objekter, være et sæt af tal (eller navne) af klasser. Der er en ukendt målafhængighed - kortlægning , hvis værdier kun kendes på objekterne i den endelige træningsprøve . Det er nødvendigt at bygge en algoritme , der er i stand til at klassificere et vilkårligt objekt . $x$ $Y$ $y^{{*}}\kolon X\til Y$ $X^{m}=\{(x_{1},y_{1}),\dots ,(x_{m},y_{m})\}$ $a\kolon X\til Y$ $x\i X$

Probabilistisk udsagn af problemet

Den sandsynlige redegørelse for problemet betragtes som mere generel. Det antages, at sættet af par "objekt, klasse" er et sandsynlighedsrum med et ukendt sandsynlighedsmål . Der er et begrænset træningssæt af observationer genereret i henhold til sandsynlighedsmålingen . Det er nødvendigt at bygge en algoritme , der er i stand til at klassificere et vilkårligt objekt . $X \ gange Y$ ${\mathsf P}$ $X^{m}=\{(x_{1},y_{1}),\dots ,(x_{m},y_{m})\}$ ${\mathsf P}$ $a\kolon X\til Y$ $x\i X$

Feature space

Et skilt er en kortlægning , hvor er sættet af tilladte værdier for et skilt. Hvis træk er givet , kaldes vektoren en trækbeskrivelse af objektet . Vejledende beskrivelser kan identificeres med selve objekterne. I dette tilfælde kaldes sættet et feature space . ${\displaystyle f\colon X\to D_{f))$ $D_f$ ${\displaystyle f_{1},\dots ,f_{n))$ ${{\mathbf x}}=(f_{1}(x),\dots ,f_{n}(x))$ $x\i X$ $X=D_{{f_{1}}}\ gange \dots \time D_{{f_{n}}}$

Afhængigt af sættet er skilte opdelt i følgende typer: $D_f$

binært tegn: ; $D_{f}=\{0,1\}$
nominel attribut: - endelig mængde; $D_f$
ordinal attribut: - endeligt ordnet sæt; $D_f$
kvantitativt tegn: - sæt af reelle tal . $D_f$

Ofte er der anvendte problemer med forskellige typer funktioner, ikke alle metoder er egnede til deres løsning.

Typologi af klassifikationsproblemer

Input datatyper

En vejledende beskrivelse er det mest almindelige tilfælde. Hvert objekt er beskrevet af et sæt af dets egenskaber, kaldet funktioner . Funktioner kan være numeriske eller ikke-numeriske.
Afstandsmatrix mellem objekter. Hvert objekt er beskrevet med afstande til alle andre objekter i træningssættet. Få metoder fungerer med denne type input, især den nærmeste nabometode , Parzen-vinduemetoden , metoden for potentielle funktioner .
En tidsserie eller et signal er en sekvens af målinger over tid. Hver dimension kan repræsenteres af et tal, en vektor og i det generelle tilfælde en vejledende beskrivelse af det objekt, der undersøges på et givet tidspunkt.
Billed- eller videosekvens .
Der er også mere komplekse tilfælde, hvor inputdata præsenteres i form af grafer , tekster , databaseforespørgselsresultater osv . Som regel reduceres de til det første eller andet tilfælde ved at forbehandle dataene og udtrække funktioner .

Klassificeringen af signaler og billeder kaldes også for mønstergenkendelse .

Klassetyper

Klassificering i to klasser . Den mest teknisk simple sag, som tjener som grundlag for løsning af mere komplekse problemer.
Multiklasse klassifikation. Når antallet af klasser når mange tusinde (for eksempel ved genkendelse af hieroglyffer eller kontinuerlig tale), bliver opgaven med klassificering meget vanskeligere.
ikke-overlappende klasser.
overlappende klasser. Et objekt kan tilhøre flere klasser på samme tid.
Fuzzy klasser . Det er nødvendigt at bestemme graden af tilhørsforhold af et objekt til hver af klasserne, normalt er det et reelt tal fra 0 til 1.

Se også

Litteratur

Ayvazyan S. A., Buchstaber V. M., Enyukov I. S., Meshalkin L. D. Anvendt statistik : klassificering og dimensionalitetsreduktion . - M .: Finans og statistik, 1989.
Vapnik VN Rekonstruktion af afhængigheder baseret på empiriske data. — M.: Nauka, 1979.
Zhuravlev Yu. I. , Ryazanov V. V., Senko O. V. "Anerkendelse". Matematiske metoder. Software system. Praktiske anvendelser. — M.: Fazis, 2006. ISBN 5-7036-0108-8 .
Zagoruiko NG Anvendte metoder til data- og videnanalyse. - Novosibirsk : IM SO RAN, 1999. ISBN 5-86134-060-9 .
Shlesinger M., Glavach V. Ti forelæsninger om statistisk og strukturel genkendelse. - Kiev : Naukova Dumka , 2004. ISBN 966-00-0341-2 .
Hastie, T., Tibshirani R., Friedman J. Elementerne i statistisk læring: Data Mining, Inferens og Forudsigelse . — 2. udg. - Springer-Verlag, 2009. - 746 s. - ISBN 978-0-387-84857-0 . .
Mitchell T. Machine Learning. — McGraw-Hill Science/Engineering/Math, 1997. ISBN 0-07-042807-7 .

Kunstig intelligens
Historie	Historien om kunstig intelligens Vinter med kunstig intelligens Dartmouth Seminar
Filosofi	Turing test kinesisk værelse Stærk og svag kunstig intelligens Venlig kunstig intelligens Etik om kunstig intelligens Kontrol problem
Vejbeskrivelse	Agent tilgang Adaptiv kontrol Viden Engineering Levedygtig systemmodel Maskinelæring Neuralt netværk sløret logik naturlig sprogbehandling Mønster genkendelse Sværm intelligens Symbolsk AI Evolutionære algoritmer Ekspertsystem
Ansøgning	Stemmekontrol Klassificeringsproblem Dokumentklassificering Dokumentklynger klyngeanalyse Lokal søgning Maskinoversættelse Optisk tegngenkendelse Tale genkendelse Håndskriftsgenkendelse Spil AI
Forskere	Charles Babbage Vladimir Vapnik Joseph Weizenbaum Norbert Wiener Victor Glushkov Vladimir Gorodetsky Jan LeCun Alexey Lyapunov John McCarthy Marvin Minsky Allen Newell Seymour Papert Juda Perle Germogen Pospelov Dmitry Pospelov Frank Rosenblatt Herbert Alexander Simon Alan Turing Patrick Winston Victor Finn Sergey Fomin Demis Hassabis Geoffrey Hinton Noam Chomsky Claude Shannon Andrew Eun Eliezer Yudkovsky

Machine learning og data mining
Opgaver	Klassificeringsproblem Læring uden lærer Lærerassisteret læring Regressions analyse AutoML Foreningens regler Feature Extraction Træning af træk Ranking træning Grammatisk afledning Online læring
At lære med en lærer	k-nærmeste nabo metode Naiv Bayes Classifier beslutningstræ Support vektor maskine Lineær regression Logistisk regression perceptron Ensembler af modeller Bagning boostning tilfældig skov Relevant vektormetode
klyngeanalyse	k-betyder metode Fuzzy klyngemetode Hierarkisk klyngedannelse EM algoritme BIRKE HELBREDE DBSCAN OPTIK Middel-forskydning
Dimensionalitetsreduktion	Faktoranalyse Hovedkomponentmetode CCA ICA LDA Ikke-negativ matrixudvidelse t-SNE
Strukturel prognose	Graf probabilistisk model Bayesiansk netværk Skjult Markov-model CRF
Anomali detektion	k-nærmeste nabo metode Lokalt emissionsniveau
Grafer sandsynlighedsmodeller	Bayesiansk netværk Markov netværk Skjult Markov-model
Neurale netværk	Begrænset Boltzmann-maskine selvorganiserende kort Aktiveringsfunktion Sigmoid softmax Radial basisfunktion Rygformeringsmetode Dyb læring Flerlagsperceptron Tilbagevendende neurale netværk lang korttidshukommelse Kontrolleret tilbagevendende blokering Konvolutionelt neuralt netværk U-net Autoencoder
Forstærkende læring	Markov proces Bellmans ligning Grådig algoritme Q-læring SARSA Temporal forskel (TD)
Teori	Vapnik-Chervonenkis teori Bias-Dispersion Dilemma Beregningsmæssig læringsteori Empirisk risikominimering Occams læring PAC læring Statistisk læringsteori
Tidsskrifter og konferencer	NeurIPS ICML ML JMLR ArXiv:cs.LG