Geometrisk centrum

Det geometriske centrum af et diskret sæt punkter i det euklidiske rum (i statistiske termer - prøver) er det punkt, hvor summen af ​​afstande til punkter i sættet er minimeret. Det geometriske center generaliserer medianen til en matematisk statistik, der minimerer afstande i en endimensionel dataprøve. Det geometriske centrum afspejler således den centrale tendens i højdimensionelle rum. Begrebet kendes også under navnene 1-median [1] , rumlig median [2] eller Torricelli-punkt [3] .

Det geometriske centrum er en vigtig skiftestimator i statistik [4] , hvor dette koncept er kendt som L 1 - score [5] . At finde det geometriske centrum er også en standardopgave ved placering af objekter , hvor objekternes placering (produktion eller forbrug) modelleres for at minimere transportomkostninger [6]

Et særligt tilfælde af problemet for tre punkter i planet (det vil sige m =3 og n =2 i termerne beskrevet nedenfor) beskrives nogle gange som Fermats problem. Det opstår i konstruktionen af ​​minimale Steiner-træer og blev først stillet som et problem af Pierre de Fermat og løst af Evangelista Torricelli [7] . Løsningen på dette problem er nu kendt som Fermat-punktet i trekanten [8] . Til gengæld kan søgningen efter det geometriske centrum generaliseres til problemet med at minimere summen af ​​vægtede afstande. Dette problem er kendt som Weber-problemet , fordi Alfred Weber diskuterede dette problem i en bog fra 1909 om objektplacering [2] . Nogle kilder bruger i stedet navnet Fermat–Weber problem [9] , men nogle kilder bruger det samme navn for det uvægtede problem [10]

Vesolovsky [11] gav en oversigt over det geometriske centerproblem. Se artiklen af ​​Fekete, Michel og Boyer [12] for en diskussion af generaliseringen af ​​problemet til tilfældet med ikke-diskrete mængder.

Definition

Formelt givet et sæt indeholdende m punkter , hvor alle , er det geometriske centrum defineret som

geometrisk centrum

Bemærk, at arg min her betyder værdien af ​​argumentet , ved hvilken minimumsummen er nået. Dette er det punkt , hvor summen af ​​alle euklidiske afstande til , er minimal.

Egenskaber

Særlige lejligheder

Beregning

Selvom konceptet om det geometriske centrum er let at forstå, er dets beregning vanskelig. Tyngdepunktet for en trekant (det vil sige dens massecentrum ), defineret på samme måde som det geometriske centrum som minimering af summen af ​​kvadratiske afstande til hvert punkt, kan opnås ved hjælp af simple formler - dens koordinater er det aritmetiske middelværdi af koordinaterne punkterne. Imidlertid kendes ingen sådan simpel formel for det geometriske centrum. Det er endda blevet vist, at der hverken er en eksplicit formel eller en nøjagtig algoritme, der kun bruger aritmetiske og radix-operationer. Der er således kun tilnærmelser til at løse dette problem [16] .

Det er dog muligt at beregne en tilnærmelse til det geometriske centrum ved hjælp af en iterativ procedure, hvor hvert trin giver en mere nøjagtig tilnærmelse. Procedurer af denne type kan udledes af det faktum, at summen af ​​afstande til prøvepunkter er en konveks funktion , da afstanden til hvert prøvepunkt er en konveks funktion, og summen af ​​konvekse funktioner også er en konveks funktion. Proceduren for at reducere summen af ​​afstande kan således ikke falde ind i det lokale optimum .

En sådan tilgang er Weisfeld-algoritmen ( André Weisfeld ) [17] [18] [19] som er en type iterativ vægtet mindste kvadraters metode med varierende vægte. Denne algoritme sætter et sæt vægte, der er omvendt proportionale med afstandene til den aktuelle tilnærmelse, og beregner en ny tilnærmelse, der er det vægtede gennemsnit af prøvepunkterne i henhold til disse vægte. Det er

Metoden konvergerer fra næsten alle startpositioner, men kan mislykkes, hvis tilnærmelsen ender ved et af prøvepunkterne. Algoritmen kan modificeres på en sådan måde, at den vil konvergere for alle udgangspunkter [14] .

Bose, Mageshwari og Morin [10] beskrev en mere sofistikeret optimeringsprocedure til at finde en omtrentlig optimal løsning på et givet problem. Som Ne, Parrilo og Starmfils [20] har vist , kan problemet opfattes som et semibestemt programmeringsproblem .

Cohen, Lee, Miller og Pachoki [21] viste, hvordan man beregner det geometriske centrum til vilkårlig præcision i næsten lineær tid.

Beskrivelse af det geometriske centrum

Hvis punkt y er forskelligt fra alle givne prøvepunkter x j , så er y det geometriske centrum, hvis og kun hvis

Dette svarer til

som er tæt knyttet til Weisfeld-algoritmen.

Generelt er y et geometrisk centrum, hvis og kun hvis der er vektorer u j sådan

hvor for x j ≠ y ,

og for x j = y ,

En tilsvarende formulering af denne tilstand

Generaliseringer

Det geometriske centrum kan generaliseres fra euklidiske rum til generelle Riemann-manifolds (og endda metriske rum ) ved at bruge den samme idé, som bruges til at definere Fréchet-middelværdien på Riemann-manifolds [22] . Lade være en Riemannmanifold med en afstand funktion , lad være vægte, der summer til 1, og lad være observationer fra . Derefter definerer vi det vægtede geometriske centrum (eller vægtede Fréchet-middelværdi) af datapunkterne

.

Hvis alle vægte er ens, siger vi, hvad der er det geometriske centrum.

Noter

  1. Det mere generelle k -medianproblem spørger om positionen af ​​k - centre, der minimerer summen af ​​afstande fra hvert punkt i sættet til det nærmeste centrum.
  2. 1 2 Drezner, Klamroth, Schöbel, Wesolowsky, 2002 .
  3. Cieslik, 2006 .
  4. Lawera, Thompson, 1993 .
  5. 1 2 3 4 Lopuhaä, Rousseeuw, 1991 .
  6. Eiselt, Marianov, 2011 .
  7. Krarup, Vajda, 1997 .
  8. Spanien, 1996 .
  9. Brimberg, 1995 .
  10. 1 2 Bose, Maheshwari, Morin, 2003 .
  11. Wesolowsky, 1993 .
  12. Fekete, Mitchell, Beurer, 2005 .
  13. 1 2 3 Haldane, 1948 .
  14. 12 Vardi, Zhang, 2000 .
  15. Cieslik, 2006 ; Plastry, 2006 . Det konvekse tilfælde blev først bevist af Giovanni Fagnano .
  16. Bajaj, 1986 ; Bajaj, 1988 . Tidligere Cockayne og Melzak Cockayne, Melzak, 1969 beviste, at Steiner-punktet for 5 punkter i flyet ikke kan konstrueres ved hjælp af et kompas og en lige
  17. Weiszfeld, 1937 .
  18. Kuhn, 1973 .
  19. Chandrasekaran, Tamir, 1989 .
  20. Nie, Parrilo, Sturmfels, 2008 .
  21. Cohen, Lee, Miller, Pachocki, Sidford, 2016 .
  22. Fletcher, Venkatasubramanian, Joshi, 2009 .

Litteratur