Selvorganiserende kort over Kohonen

Kohonens selvorganiserende kort ( engelsk Self-organizing map - SOM) er et uovervåget neuralt netværk , der udfører opgaven med visualisering og klyngedannelse . Idéen med netværket blev foreslået af den finske videnskabsmand T. Kohonen . Det er en metode til at projicere et multidimensionelt rum ind i et rum med en lavere dimension (oftest todimensionelt), det bruges også til at løse problemer med modellering, prognose, identifikation af sæt af uafhængige funktioner, søgning efter mønstre i store datasæt , udvikling af computerspil, kvantificering af farver til deres begrænsede antal indekser i farvepaletten: ved udskrivning på en printer og tidligere på en pc eller på set-top-bokse med et display med et reduceret antal farver, til arkivering [generelt formål] eller video-codecs osv. Det er en af versionerne af Kohonens neurale netværk .

Historie

Metoden blev foreslået af den finske videnskabsmand Teuvo Kohonen i 1984. Der er mange modifikationer af den originale model.

Netværksstruktur

Et selvorganiserende kort består af komponenter kaldet noder eller neuroner. Deres antal er fastsat af analytikeren . Hver af knudepunkterne er beskrevet af to vektorer. Den første er den såkaldte. en vektor med vægt m , der har samme dimension som inputtet. Den anden er vektoren r , som er koordinaterne for knudepunktet på kortet. Kohonen-kortet vises visuelt ved hjælp af rektangulære eller sekskantede celler; sidstnævnte bruges oftere, da afstandene mellem centrene af tilstødende celler i dette tilfælde er de samme, hvilket øger korrektheden af kortvisualiseringen.

Indledningsvis er dimensionen af inputdataene kendt; på en eller anden måde er den oprindelige version af kortet bygget på det. Under indlæringsprocessen nærmer knudevægtsvektorerne sig inputdataene. For hver observation (prøve) vælges den mest ensartede node med hensyn til vægtvektor, og værdien af dens vægtvektor nærmer sig observationen. Vægtvektorerne for flere knudepunkter i nærheden nærmer sig også observationen, så hvis to observationer var ens i inputdatasættet, vil tætte knudepunkter svare til dem på kortet. Den cykliske læringsproces, der itererer over inputdataene, slutter, når kortet når en acceptabel (forudbestemt af analytikeren) fejl eller efter et specificeret antal iterationer. Som et resultat af træning klassificerer Kohonen-kortet således inputdataene i klynger og viser visuelt multidimensionelle inputdata i et todimensionelt plan, distribuerer vektorer af tætte træk ind i naboceller og farver dem afhængigt af de analyserede parametre for neuroner.

Som et resultat af algoritmen opnås følgende kort:

neuroninputkort — visualiserer den interne struktur af inputdataene ved at justere vægten af kortneuronerne. Normalt bruges flere inputkort, som hver viser et af dem og er farvet afhængigt af neurons vægt. På et af kortene angiver en bestemt farve området, som omfatter omtrent de samme input til de analyserede eksempler.
neuron output map - visualiserer en model af den relative position af input eksempler. De skitserede områder på kortet er klynger bestående af neuroner med lignende outputværdier.
specialkort er et kort over klynger opnået som et resultat af anvendelsen af Kohonens selvorganiserende kortalgoritme, såvel som andre kort, der karakteriserer dem. [en]

Netværksdrift

Kortinitialisering, det vil sige den indledende tildeling af vægtvektorer for noder.
Cyklus:
- Valg af næste observation (en vektor fra et sæt af input).
- At finde den bedst matchende enhed til det (BMU eller vinder) - en node på kortet, hvis vægtvektor er mindst forskellig fra observationen (i metrikken indstillet af analytikeren, oftest euklidisk).
- Bestemmelse af antallet af BMU-naboer og læring - ændring af vægtvektorerne for BMU'en og dens naboer for at tilnærme dem til observationen.
- Definition af kortfejl.

Algoritme

Initialisering

Der er tre mest almindelige måder at indstille de indledende nodevægte på:

- Indstilling af alle koordinater med tilfældige tal.
- Tildeling af værdien af en tilfældig observation fra input til vægtvektoren.
- Udvælgelse af vægtvektorer fra det lineære rum spændt over af hovedkomponenterne i inputdatasættet.
Cyklus

Lad være iterationsnummeret (initialisering svarer til nummer 0). $t$

- Vælg en vilkårlig observation fra et sæt inputdata. $x(t)$
- Find afstandene fra den til vægtvektorerne for alle knudepunkter på kortet, og bestem den nærmeste knude med hensyn til vægt . Dette er BMU eller Vinder. Betingelse for : $M_c(t)$ $M_c(t)$

\| x(t)-m_c(t)\|\leq\| x(t)-m_i(t)\|

, for enhver , hvor er nodens vægtvektor . Hvis der er flere noder, der opfylder betingelsen, vælges BMU'en tilfældigt blandt dem.

m_i(t)

m_i(t)

M_i(t)

- Brug funktionen (nabofunktion) til at bestemme naboerne og ændre deres vægtvektorer. $h$ $M_c$
  - Dyrke motion $h$

Funktionen bestemmer "nabomålet" for noder og ændringen i vægtvektorer. Det bør gradvist forfine deres værdier, først ved et større antal noder og stærkere, derefter ved en mindre og svagere. Ofte bruges en Gauss-funktion som en nabofunktion:

M_{i}

M_c

h_{ci}(t)=\alpha(t)\cdot\exp(-\frac{\|r_c-r_i\|^2}{2\sigma^2(t)})

hvor er en træningsfaktor, der monotont aftager med hver efterfølgende iteration (det vil sige, den bestemmer tilnærmelsen af værdien af vægtvektorerne for BMU'en og dens naboer til observationen; jo større trin, jo mindre raffinement);

0<\alfa(t)<1

r_{i}

, - koordinater af noder og på kortet;

r_{c}

M_i(t)

M_c(t)

\sigma(t)

— faktoren, der reducerer antallet af naboer med iterationer, falder monotont. Parametre og deres karakter af fald er fastsat af analytikeren.

\alfa

\sigma

En nemmere måde at definere en nabofunktion på:

h_{ci}(t)=\alpha(t)

, hvis det er i nærheden af en radius forudbestemt af analytikeren, og 0 ellers.

M_i(t)

M_c(t)

Funktionen er ens for BMU og aftager med afstanden fra BMU.

h(t)

\alfa(t)

- - Ændring af vægtvektorer

Skift vægtvektoren i henhold til formlen:

m_i(t)=m_i(t-1)+h_{ci}(t)\cdot(x(t)-m_i(t-1))

At. vægtvektorerne for alle knudepunkter, der er naboer til BMU, nærmer sig den betragtede observation.

- Kortfejlberegning

For eksempel, som det aritmetiske gennemsnit af afstandene mellem observationer og vægtvektorerne for deres tilsvarende BMU'er:

\frac{1}{N}\sum_{i=1}^{N}\|x_{i}-m_{c}\|

, hvor N er antallet af elementer i inputdatasættet.

Funktioner af modellen

Modstandsdygtighed over for støjende data, hurtig og uovervåget læring, evne til at forenkle multivariate inputdata med visualisering. [2]

Selvorganiserende Kohonen-kort kan kun bruges til klyngeanalyse, hvis antallet af klynger er kendt på forhånd [2] .

En vigtig ulempe er, at det endelige resultat af arbejdet med neurale netværk afhænger af netværkets indledende indstillinger. På den anden side kan neurale netværk teoretisk tilnærme enhver kontinuerlig funktion, hvilket gør det muligt for forskeren ikke at opstille nogen hypoteser om modellen på forhånd [2] .

Se også

Noter

↑ Chubukova, 2000 , s. 140.
↑ 1 2 3 Manzhula, 2011 .

Litteratur

T. Kohonen , Self-Organizing Maps (Third Extended Edition), New York, 2001, 501 sider. ISBN 3-540-67921-9
Debock G., Kohonen T. Finansiel dataanalyse med selvorganiserende kort, Alpina Publisher, 2001, 317 s. ISBN 5-89684-013-6
Zinoviev A. Yu Visualisering af multidimensionelle data . - Krasnojarsk: Udg. Krasnoyarsk State Technical University, 2000. - 180 s.
Chubukova I.A. data mining . - 2000. - 326 s.
Manzhula V.G., Fedyashov D.S. Kohonen Neurale Netværk og Fuzzy Neurale Netværk i Data Mining . – 2011.
Lakhmi C. Jain; NM Martin Fusion af neurale netværk, fuzzy systemer og genetiske algoritmer: industrielle applikationer. — CRC Press, CRC Press LLC, 1998

Links

SOM-Research på Helsinki University of Technologys hjemmeside
WEBSOM , et Kohonen-netværksprojekt
PCA, SOM og GSOM: applet , E. M. Mirkes og University of Leicester. Hovedkomponentanalyse, selvorganiserende kort og voksende selvorganiserende kort. Kapitel i en online lærebog med programmer, der giver dig mulighed for at udføre sammenlignende undersøgelser.
Foredrag om selvorganisering af Kohonen-kort

Typer af kunstige neurale netværk

Feed-forward-netværk ( Netværk af radiale basisfunktioner )
Enkeltlags perceptron
Flerlagsperceptron ( Rosenblatt • Rumelhart )
Hopfield netværk
Markov kæde
Boltzmann maskine
Begrænset Boltzmann-maskine
Autoencoder ( Denoise autoencoder • Sparse autoencoder • Variationel autoencoder )
Dybt net af tillid
Konvolutionelt neuralt netværk
Deep Convolutional Neural Network
Udrulning af neuralt netværk
Deep Convolutional Inverse Graphic Network
Generativt modstridende netværk
Tilbagevendende neurale netværk
Rekursive neurale netværk
lang korttidshukommelse
Kontrolleret tilbagevendende blokering
Neurale Turing-maskiner
Tovejsnetværk ( Bidirektionalt tilbagevendende neuralt netværk • Tovejsnetværk med langtidshukommelse • Tovejskontrollerede tilbagevendende neuroner )
Deep Residual Network
Neural ekko netværk
Ekstrem læringsmetode
Metode til ustabile tilstande
Support vektor maskine
Kohonen netværk
Selvorganiserende kort over Kohonen
Kapsel neuralt netværk
Associativ hukommelse på neurale netværk

Machine learning og data mining
Opgaver	Klassificeringsproblem Læring uden lærer Lærerassisteret læring Regressions analyse AutoML Foreningens regler Feature Extraction Træning af træk Ranking træning Grammatisk afledning Online læring
At lære med en lærer	k-nærmeste nabo metode Naiv Bayes Classifier beslutningstræ Support vektor maskine Lineær regression Logistisk regression perceptron Ensembler af modeller Bagning boostning tilfældig skov Relevant vektormetode
klyngeanalyse	k-betyder metode Fuzzy klyngemetode Hierarkisk klyngedannelse EM algoritme BIRKE HELBREDE DBSCAN OPTIK Middel-forskydning
Dimensionalitetsreduktion	Faktoranalyse Hovedkomponentmetode CCA ICA LDA Ikke-negativ matrixudvidelse t-SNE
Strukturel prognose	Graf probabilistisk model Bayesiansk netværk Skjult Markov-model CRF
Anomali detektion	k-nærmeste nabo metode Lokalt emissionsniveau
Grafer sandsynlighedsmodeller	Bayesiansk netværk Markov netværk Skjult Markov-model
Neurale netværk	Begrænset Boltzmann-maskine selvorganiserende kort Aktiveringsfunktion Sigmoid softmax Radial basisfunktion Rygformeringsmetode Dyb læring Flerlagsperceptron Tilbagevendende neurale netværk lang korttidshukommelse Kontrolleret tilbagevendende blokering Konvolutionelt neuralt netværk U-net Autoencoder
Forstærkende læring	Markov proces Bellmans ligning Grådig algoritme Q-læring SARSA Temporal forskel (TD)
Teori	Vapnik-Chervonenkis teori Bias-Dispersion Dilemma Beregningsmæssig læringsteori Empirisk risikominimering Occams læring PAC læring Statistisk læringsteori
Tidsskrifter og konferencer	NeurIPS ICML ML JMLR ArXiv:cs.LG