Topologisk dataanalyse er et nyt område inden for teoretisk forskning for datamining og computersynsproblemer .
Hovedspørgsmål:
Den menneskelige hjerne bygger let en idé om den generelle struktur ud fra særlige lavdimensionelle data. For eksempel er det ikke svært for ham at opnå den tredimensionelle form af et objekt fra flade billeder i hvert øje. Skabelsen af en fælles struktur udføres også ved at kombinere fragmenter diskrete i tid til et kontinuerligt billede. Så for eksempel er et tv-billede teknisk set en række individuelle prikker, som dog opfattes som en enkelt scene.
Den vigtigste metode til topologisk dataanalyse:
Dataene er ofte repræsenteret af et sæt punkter i det euklidiske rum En , hvis form afspejler det fænomen, som dataene beskriver.
Ægte tredimensionelle objekter kan repræsenteres som en sky af punkter . For eksempel er individuelle punkter markeret med en laser, og deres ustrukturerede sæt fungerer som en computerrepræsentation af objektet. En punktsky er et hvilket som helst (muligvis støjende) sæt af punkter i E n eller projektioner af punkter i en lavere dimension.
I computergrafik og statistik er der forskellige metoder til at konstruere forbilleder fra projektioner. Topologisk dataanalyse er designet til højdimensionelle rum eller rum, der er for buede til at kunne skabe flade projektioner fra dem.
For at omdanne en sky af punkter i et metrisk rum til et integreret objekt, bruges punkterne som hjørnerne af grafen , hvis kanter er tildelt afstande, derefter bliver grafen forvandlet til et simpelt kompleks og studeret ved hjælp af algebraisk topologi.