Dempster-Schafer teori

Dempster-Schafer-teorien  er en matematisk bevisteori ([SH76]) baseret på trosfunktioner og plausible ræsonnementer , som bruges til at kombinere separate oplysninger (beviser) for at beregne sandsynligheden for en begivenhed. Teorien blev udviklet af Arthur P. Dempster og Glenn Schafer .

Overvej to mulige spillere

Det første spil er et møntkast, hvor der satses på, om det kommer op i hoveder eller haler. Forestil dig nu et andet spil, hvor der satses på udfaldet af en kamp mellem den bedste bokser i verden og den bedste wrestler i verden. Antag, at vi er uvidende om kampsport, og det er meget svært for os at beslutte, hvem vi skal satse på.

Mange mennesker vil være mindre sikre på situationen i det andet spil, hvor sandsynligheden er ukendt, end i det første spil, hvor det er let at se, at sandsynligheden for hvert udfald er halvt. I tilfælde af det andet spil vil Bayesiansk teori tildele halvdelen af ​​sandsynligheden til hvert udfald, uanset den information, der gør det ene af udfaldene mere sandsynligt end det andet. Dempster-Schafer-teorien giver dig mulighed for at bestemme graden af ​​tillid hos spilleren med hensyn til de sandsynligheder, der er tildelt forskellige udfald.

Formalisering

Lad være  det universelle sæt , sættet af alle udsagn under overvejelse. Det eksponentielle sæt, , er samlingen af ​​alle delmængder af sættet , inklusive det tomme sæt . For eksempel, hvis:

derefter

Per definition er massen af ​​det tomme sæt nul:

Masserne af de resterende elementer i den eksponentielle mængde normaliseres til en enhedssum:

Massen af ​​et element i den eksponentielle mængde udtrykker forholdet mellem alle relevante og tilgængelige beviser, der understøtter påstanden om, at et bestemt element tilhører , men ikke tilhører nogen delmængde af . Mængden refererer kun til mængden og skaber ikke yderligere udsagn om de andre delmængder , som hver per definition har sin egen masse.

Baseret på de tildelte masser er det muligt at bestemme de øvre og nedre grænser for rækken af ​​muligheder. Dette interval indeholder den nøjagtige værdi af sandsynligheden for den delmængde, der overvejes (i klassisk forstand), og er begrænset af to ikke-additive kontinuerlige mål kaldet tro ( eller støtte ) og plausibilitet ( plausibilitet ) :

Sættets konfidens er defineret som summen af ​​alle masser af korrekte delmængder af det betragtede sæt:

Sandsynligheden  er summen af ​​masserne af alle mængder, der krydser det betragtede sæt :

Disse to mål er relateret til hinanden som følger:

Det følger af ovenstående, at det er nok at kende mindst et af målene (masse, tillid eller sandsynlighed) for at beregne de resterende to.

Overvej problemet med at kombinere to uafhængige sæt af tildelte masser. Den oprindelige sammenføjningsregel, kendt som Dempsters kombinationsregel , er en generalisering af Bayes' regel. Denne regel understreger overensstemmelse mellem flere kilder og ignorerer alle modstridende beviser gennem normalisering. Lovligheden af ​​at bruge denne regel sættes alvorligt i tvivl i tilfælde af væsentlige uoverensstemmelser mellem informationskilder.

Faktisk beregnes foreningen (kaldet den tilføjede masse ) ud fra to sæt masser og som følger:

hvor:

er et mål for konflikten mellem to sæt masser. Den normaliserende faktor, , svarer til fuldstændig at ignorere uoverensstemmelser og tildele et tomt sæt til enhver masse svarende til en konflikt. Derfor fører denne operation til kontraintuitive resultater i tilfælde af væsentlig konflikt under visse omstændigheder.

Diskussion

Troværdighed og troværdighed

Shafers tilgang tillader os at fortolke tillid og sandsynlighed som grænserne for intervallet for den mulige værdi af hypotesens sandhed:

tillid ≤ en vis grad af sandhed ≤ plausibilitet .

Det antages, at:

Tillid til hypotesen = {summen af ​​masser af beviser, der utvetydigt understøtter hypotesen}. Sandsynlighed = 1 − {summen af ​​masserne af alle beviser, der modsiger hypotesen}.

Lad os for eksempel sige, at vi har hypotesen "katten i æsken er død". Hvis tilliden for hende er 0,5 og sandsynligheden er 0,8, så betyder det, at vi har beviser (med en samlet vægt på 0,5), der utvetydigt indikerer, at katten er død; men der er også evidens (med en totalvægt på 0,2), der entydigt indikerer, at katten er i live (sandsynlighed for "katten er død" = 1 − 0,2 = 0,8). Den resterende masse (som komplementerer 0,5 og 0,2 til 1,0), som også er afstanden mellem sandsynligheden på 0,8 og konfidensen på 0,5, svarer til "usikkerheden" ("universel" hypotese), tilstedeværelsen af ​​beviser for, at der absolut er en kat i kassen, men siger ikke noget om, hvorvidt han er levende eller død.

I alt er intervallet [0,5; 0.8] karakteriserer usikkerheden om sandheden af ​​den indledende hypotese, baseret på den tilgængelige evidens.

Hypotese Vægt Tillid Plausibilitet
Nul (ingen kat) 0 0 0
I live 0,2 0,2 0,5
Død 0,5 0,5 0,8
Universal (enten levende eller død) 0,3 1.0 1.0

Vægten af ​​"nul"-hypotesen er sat til 0 per definition (det svarer til tilfælde af "ingen beslutning" eller en uløselig modsætning mellem beviserne). Dette fører til det faktum, at tilliden til "nul"-hypotesen er 0, og sandsynligheden for den "universelle" hypotese er 1. Da massen af ​​den "universelle" hypotese er beregnet ud fra masserne af "levende" og " døde” hypoteser, så er dens konfidens automatisk lig med 1, og sandsynligheden for nulhypotesen er 0.

Lad os tage et lidt mere komplekst eksempel, der demonstrerer funktionerne i tillid og plausibilitet. Antag, at vi bruger et sæt detektorer til at registrere en enkelt fjern signalbrand, som kan være en af ​​tre farver (rød, gul eller grøn):

Hypotese Vægt Tillid Plausibilitet
Nul 0 0 0
Rød 0,35 0,35 0,56
Gul 0,25 0,25 0,45
Grøn 0,15 0,15 0,34
Rød eller gul 0,06 0,66 0,85
Rød eller Grøn 0,05 0,55 0,75
Gul eller Grøn 0,04 0,44 0,65
Universel 0,10 1.00 1.00

hvor fx:

Konfidens(rød eller gul) = masse(nulhypotese) + masse(rød) + masse(gul) + masse(rød eller gul) = 0 + 0,35 + 0,25 + 0,06 = 0,66 Sandsynlighed(rød eller gul) = 1 − Tillid(Rød eller Gul Benægtelse) = 1 − Tillid(Grøn) = 1 − Masse(Nulhypotese) − Masse(Grøn) = 1 − 0 − 0,15 = 0,85

Begivenhederne i dette sæt bør ikke betragtes som skæringspunktet mellem begivenheder i sandsynlighedsrummet, da de er givet i masserummet. Det er mere korrekt at betragte begivenheden "Rød eller Gul" som foreningen af ​​begivenhederne "Rød" og "Gul", og (se sandsynlighedsteoriens aksiomer) P(Rød eller Gul) ≥ P(Gul) og P (Universal) = 1, hvor "Universal ' hypotese svarer til 'Rød', 'Gul' eller 'Grøn'. I TDS svarer massen af ​​den "universelle" hypotese til et stykke bevis, der ikke kan tilskrives nogen anden hypotese; det vil sige beviser, der hævder, at der var en form for signal, men som slet ikke taler om dets farve.

I dette eksempel er "Rød eller Grøn" beviset tildelt en masse på 0,05. Sådanne beviser kunne f.eks. fås fra personer med rød/grøn blindhed. TDS giver os mulighed for at overveje sådanne beviser på en afbalanceret måde.

Litteratur

Se også