Topologisk dataanalyse

Topologisk dataanalyse  er et nyt område inden for teoretisk forskning for datamining og computersynsproblemer .

Hovedspørgsmål:

  1. Hvordan man får højdimensionelle strukturer fra lavdimensionelle repræsentationer;
  2. Hvordan diskrete enheder lægger op til globale strukturer.

Den menneskelige hjerne bygger let en idé om den generelle struktur ud fra særlige lavdimensionelle data. For eksempel er det ikke svært for ham at opnå den tredimensionelle form af et objekt fra flade billeder i hvert øje. Skabelsen af ​​en fælles struktur udføres også ved at kombinere fragmenter diskrete i tid til et kontinuerligt billede. Så for eksempel er et tv-billede teknisk set en række individuelle prikker, som dog opfattes som en enkelt scene.

Den vigtigste metode til topologisk dataanalyse:

  1. Udskiftning af et sæt af dataelementer med en familie af simple komplekser i overensstemmelse med nærhedsparameteren.
  2. Analyse af disse topologiske komplekser ved hjælp af algebraisk topologi , og specifikt ved den nye teori om vedvarende homologi .
  3. Omkodning af den stabile homologi af et datasæt til en parametriseret version af Betti-numre , kaldet en stregkode .

Punktsky

Dataene er ofte repræsenteret af et sæt punkter i det euklidiske rum En , hvis form afspejler det fænomen, som dataene beskriver.

Ægte tredimensionelle objekter kan repræsenteres som en sky af punkter . For eksempel er individuelle punkter markeret med en laser, og deres ustrukturerede sæt fungerer som en computerrepræsentation af objektet. En punktsky er et hvilket som helst (muligvis støjende) sæt af punkter i E n eller projektioner af punkter i en lavere dimension.

I computergrafik og statistik er der forskellige metoder til at konstruere forbilleder fra projektioner. Topologisk dataanalyse er designet til højdimensionelle rum eller rum, der er for buede til at kunne skabe flade projektioner fra dem.

For at omdanne en sky af punkter i et metrisk rum til et integreret objekt, bruges punkterne som hjørnerne af grafen , hvis kanter er tildelt afstande, derefter bliver grafen forvandlet til et simpelt kompleks og studeret ved hjælp af algebraisk topologi.

Se også

Links