C-Means Fuzzy Clustering Method

C-means fuzzy clustering-metoden ( engelsk  fuzzy clustering, soft k-means, c-means ) giver dig mulighed for at opdele det tilgængelige sæt af elementer med en potens i et givet antal fuzzy-sæt . C -means fuzzy clustering - metoden kan betragtes som en forbedret k -means- metode , hvor for hvert element fra det undersøgte sæt beregnes graden af ​​dets medlemskab ( engelsk ansvarlighed ) til hver af klyngerne. 

Algoritmen blev udviklet af JC Dunn i 1973 [1] og forbedret af JC Bezdek i 1981 [2] .

Algoritme:

  1. Sæt tilfældigt centre af klynger ;
  2. Beregn medlemsmatricen af ​​elementer til klynger . I tilfælde af en normalfordeling : , hvor er det -. element i mængden, er centrum af klyngen ,  er afstanden mellem punkterne og , er sandsynlighedstætheden for normalfordelingen i punktet .
  3. Flyt klyngecentre ;
  4. Beregn tabsfunktionen (f.eks. baseret på maximum likelihood-princippet ). Ved normalfordeling vil tabsfunktionen være lig med: ;
  5. Hvis værdien af ​​tabsfunktionen falder, skal du gentage cyklussen fra trin 2.

Metoden til fuzzy clustering af C -midler er af begrænset brug på grund af en væsentlig ulempe - umuligheden af ​​korrekt opdeling i klynger i tilfælde af, hvor klynger har forskellig spredning i forskellige dimensioner (akser) af elementer (for eksempel har en klynge form af en ellipse). Denne mangel er elimineret i blandingsmodellerne og GMM ( Gaussiske blandingsmodeller ) algoritmer.

Links

  1. Dunn JC En uklar slægtning til ISODATA-processen og dens anvendelse til at opdage kompakte, godt adskilte klynger  // Journal of Cybernetics. - 1973. - 17. september ( bind 3 , nr. 3 ). — S. 32–57 . — ISSN 0022-0280 . - doi : 10.1080/01969727308546046 .
  2. Bezdek, James C. Mønstergenkendelse med fuzzy Objective Function Algorithms . - 1981. - ISBN 0-306-40671-3 .