K-median metode

-median -metoden $k$ [1] [2] er en variation af -averages- metoden , der bruges i statistik og maskinlæring til klyngeproblemer , hvor medianen beregnes i stedet for gennemsnittet for at bestemme klyngens tyngdepunkt . Denne tilgang svarer til at minimere fejlen over alle klynger i en 1 - norm - metrik i stedet for den 2 - norm -metrik , der bruges i standard -middel-metoden. $k$ $k$

Opgaven med at bestemme -medianer er at finde sådanne centre, at klyngerne dannet af dem vil være de mest "kompakte". Formelt, givet datapunkter , bør centrene vælges således, at summen af afstandene fra hver til den nærmeste minimeres . $k$ $k$ $x_{i}$ $k$ ${\displaystyle c_{j))$ $x_{i}$ ${\displaystyle c_{j))$

Metoden virker nogle gange bedre end -middel metoden, hvor summen af de kvadrerede afstande er minimeret. Kriteriet for summen af afstande er meget brugt til transportproblemer [3] . $k$

Et andet alternativ er -medoids- metoden , hvor der søges efter den optimale medoid , og ikke klyngemedianen (medoiden er et af datapunkterne, mens medianerne ikke behøver at være det).

Links

↑ A.K. Jain og R.C. Dubes, Algorithms for Clustering Data: Prentice-Hall, 1981.
↑ PS Bradley, OL Mangasarian og WN Street, "Clustering via Concave Minimization," i Advances in Neural Information Processing Systems, vol. 9, MC Mozer, MI Jordan og T. Petsche, red. Cambridge, MA: MIT Press, 1997, pp. 368-374.
↑ Arkiveret kopi . Hentet 24. oktober 2010. Arkiveret fra originalen 3. april 2022. (ubestemt)

Betyde
Matematik	Effektmiddel ( vægtet ) harmonisk middel vægtet geometrisk middelværdi vægtet Gennemsnit vægtet geometriske middelværdi Gennemsnitlig kubik glidende gennemsnit Aritmetisk-geometrisk middelværdi Funktion Middel Kolmogorov mener
Geometri	geometrisk centrum Barycenter
Sandsynlighedsteori og matematisk statistik	Winsoriseret middelværdi prøvegennemsnit Forventet værdi Median Mode standardafvigelse Afkortet middelværdi Betinget forventning
Informationsteknologi	Medoid k-median metode
Sætninger	Første middelsætning Anden middelsætning Ulighed om det aritmetiske, geometriske og harmoniske middelværdi
Andet	Distributionscenter-metrics

Machine learning og data mining
Opgaver	Klassificeringsproblem Læring uden lærer Lærerassisteret læring Regressions analyse AutoML Foreningens regler Feature Extraction Træning af træk Ranking træning Grammatisk afledning Online læring
At lære med en lærer	k-nærmeste nabo metode Naiv Bayes Classifier beslutningstræ Support vektor maskine Lineær regression Logistisk regression perceptron Ensembler af modeller Bagning boostning tilfældig skov Relevant vektormetode
klyngeanalyse	k-betyder metode Fuzzy klyngemetode Hierarkisk klyngedannelse EM algoritme BIRKE HELBREDE DBSCAN OPTIK Middel-forskydning
Dimensionalitetsreduktion	Faktoranalyse Hovedkomponentmetode CCA ICA LDA Ikke-negativ matrixudvidelse t-SNE
Strukturel prognose	Graf probabilistisk model Bayesiansk netværk Skjult Markov-model CRF
Anomali detektion	k-nærmeste nabo metode Lokalt emissionsniveau
Grafer sandsynlighedsmodeller	Bayesiansk netværk Markov netværk Skjult Markov-model
Neurale netværk	Begrænset Boltzmann-maskine selvorganiserende kort Aktiveringsfunktion Sigmoid softmax Radial basisfunktion Rygformeringsmetode Dyb læring Flerlagsperceptron Tilbagevendende neurale netværk lang korttidshukommelse Kontrolleret tilbagevendende blokering Konvolutionelt neuralt netværk U-Net Autoencoder
Forstærkende læring	Markov proces Bellmans ligning Grådig algoritme Q-læring SARSA Temporal forskel (TD)
Teori	Vapnik-Chervonenkis teori Bias-Dispersion Dilemma Beregningsmæssig læringsteori Empirisk risikominimering Occams læring PAC læring Statistisk læringsteori
Tidsskrifter og konferencer	NeurIPS ICML ML JMLR ArXiv:cs.LG