K-median metode

-median -metoden [1] [2] er en variation af -averages- metoden ,  der bruges i statistik og maskinlæring til klyngeproblemer , hvor medianen beregnes i stedet for gennemsnittet for at bestemme klyngens tyngdepunkt . Denne tilgang svarer til at minimere fejlen over alle klynger i en 1 - norm - metrik i stedet for den 2 - norm -metrik , der bruges i standard -middel-metoden.

Opgaven med at bestemme -medianer er at finde sådanne centre, at klyngerne dannet af dem vil være de mest "kompakte". Formelt, givet datapunkter , bør centrene vælges således, at summen af ​​afstandene fra hver til den nærmeste minimeres .

Metoden virker nogle gange bedre end -middel metoden, hvor summen af ​​de kvadrerede afstande er minimeret. Kriteriet for summen af ​​afstande er meget brugt til transportproblemer [3] .

Et andet alternativ er -medoids- metoden , hvor der søges efter den optimale medoid , og ikke klyngemedianen (medoiden er et af datapunkterne, mens medianerne ikke behøver at være det).

Links

  1. A.K. Jain og R.C. Dubes, Algorithms for Clustering Data: Prentice-Hall, 1981.
  2. PS Bradley, OL Mangasarian og WN Street, "Clustering via Concave Minimization," i Advances in Neural Information Processing Systems, vol. 9, MC Mozer, MI Jordan og T. Petsche, red. Cambridge, MA: MIT Press, 1997, pp. 368-374.
  3. Arkiveret kopi . Hentet 24. oktober 2010. Arkiveret fra originalen 3. april 2022.