Bayesiansk netværk

Den aktuelle version af siden er endnu ikke blevet gennemgået af erfarne bidragydere og kan afvige væsentligt fra den version , der blev gennemgået den 29. december 2021; checks kræver 4 redigeringer .

Bayesiansk netværk (eller Bayesiansk netværk , Bayesiansk trosnetværk , engelsk  Bayesiansk netværk, trosnetværk ) - graf probabilistisk model , som er et sæt af variabler og deres probabilistiske afhængigheder ifølge Bayes . For eksempel kan et Bayesiansk netværk bruges til at beregne sandsynligheden for, at en patient har en sygdom baseret på tilstedeværelsen eller fraværet af et sæt af symptomer, baseret på data om sammenhængen mellem symptomer og sygdomme. Bayesianske netværks matematiske apparat blev skabt af den amerikanske videnskabsmand Judah Pearl , vinder af Turing Award (2011).

Formelt er et Bayesiansk netværk en rettet acyklisk graf , hvor hvert toppunkt svarer til en tilfældig variabel, og buerne på grafen koder for betingede uafhængighedsrelationer mellem disse variable. Hjørner kan repræsentere variabler af enhver type, være vægtede parametre, latente variabler eller hypoteser. Der er effektive metoder, der bruges til at beregne og træne Bayesianske netværk. Hvis de bayesianske netværksvariable er diskrete tilfældige variable, så kaldes et sådant netværk et diskret bayesiansk netværk. Bayesianske netværk, der modellerer sekvenser af variabler, kaldes dynamiske Bayesianske netværk . Bayesianske netværk, der kan have både diskrete og kontinuerte variabler, kaldes hybride Bayesianske netværk . Et bayesiansk netværk, hvor buerne udover betingede uafhængighedsrelationer også koder kausalitetsrelationer , kaldes kausale bayesianske netværk [ 1] ) . 

Definitioner og driftsprincipper

Hvis en bue går fra et toppunkt til et toppunkt , så kaldes det en forælder og kaldes et barn . Hvis der er en rettet vej fra toppunktet til toppunktet , så kaldes det en forfader , og det kaldes en efterkommer .

Sættet af vertex-forældre til et toppunkt vil blive betegnet som .

En rettet acyklisk graf kaldes et Bayesiansk netværk for en sandsynlighedsfordeling defineret over et sæt af tilfældige variable , hvis hvert hjørne af grafen er forbundet med en tilfældig variabel fra , og buerne i grafen opfylder betingelsen (Markov betingelse [1] ): enhver variabel fra skal være betinget uafhængig af alle hjørner, der ikke er dens efterkommere, hvis alle dens direkte forældre i grafen , dvs.

retfærdig:

hvor  er værdien ;  - konfiguration[ angiv ] ;  er mængden af ​​alle toppunkter, der ikke er efterkommere af ;  - konfiguration .

Derefter kan den komplette fælles fordeling af værdier ved toppunkterne bekvemt skrives som en nedbrydning (produkt) af lokale fordelinger:

Hvis et toppunkt ikke har nogen forfædre, kaldes dets lokale sandsynlighedsfordeling ubetinget , ellers betinget . Hvis et toppunkt - en tilfældig variabel har modtaget en værdi (for eksempel som følge af observation), så kaldes en sådan værdi bevis . Hvis værdien af ​​variablen blev sat udefra (og ikke observeret), så kaldes en sådan værdi intervention ( engelsk handling ) eller intervention ( engelsk intervention ) [1] .    

Betinget uafhængighed i et Bayesiansk netværk er repræsenteret af den grafiske egenskab af d-separation .

d-separation

En sti kaldes et d -separeret eller blokeret toppunktsæt hvis og kun hvis  

  1. indeholder en kæde eller gren sådan, der hører til , eller
  2. indeholder en omvendt gaffel (collider), sådan at den ikke hører hjemme , og toppunktet har ingen børn, der tilhører .

Lade være  ikke-skærende delmængder af toppunkter i en acyklisk rettet graf . Et sæt toppunkter siges at være d-adskillende , hvis og kun hvis det blokerer alle stier fra ethvert toppunkt, der hører til ethvert toppunkt, der tilhører , og er betegnet med . En sti er en sekvens af på hinanden følgende kanter (i enhver retning) i grafen [1] .

d-adskillelsessætningen

For alle tre ikke-overlappende delmængder af hjørner i en acyklisk rettet graf og for alle sandsynlighedsfordelinger gælder følgende :

  1. hvis , så , hvis og er Markov-kompatible, og
  2. hvis forholdet mellem betinget uafhængighed gælder for alle sandsynlighedsfordelinger, der er Markov-kompatible med , så indebærer dette .

Med andre ord, hvis hjørnerne er d-adskilte, så er de betinget uafhængige; og hvis hjørnerne er betinget uafhængige i alle sandsynlighedsfordelinger, der er kompatible med grafen , så er de d-separerede [1] .

( betyder, at sæt af variabler og er betinget uafhængige for et givet sæt .)

Beviser

Evidens  - udsagn af formen "en hændelse fandt sted ved node x". For eksempel: "computeren vil ikke starte" .

Probabilistiske forespørgsler

Det Bayesianske netværk giver dig mulighed for at få svar på følgende typer af sandsynlighedsforespørgsler [2] :

forudsigelse eller direkte slutning , - bestemmelse af sandsynligheden for en begivenhed af observerbare årsager, diagnosticering eller omvendt slutning ( abduktion ), - bestemmelse af sandsynligheden for en årsag med observerede konsekvenser, intercausal (blandet) inferens ( engelsk  intercausal inference ) eller transduktion , - bestemmelse af sandsynligheden for en af ​​årsagerne til en begivenhed, forudsat at en eller flere andre årsager til denne begivenhed forekommer.

Eksempel

Lad os antage, at der kan være to årsager til, at græsset kan blive vådt (GRASS WET): Sprinkleren har virket, eller det har regnet. Antag også, at regn påvirker driften af ​​sprinkleren (under regn tænder enheden ikke). Så kan situationen modelleres af det illustrerede Bayesianske netværk. Hver af de tre variable kan kun tage én af to mulige værdier: T (sand - sand) og F (falsk - falsk), med de sandsynligheder, der er angivet i tabellerne i illustrationen.

Fælles sandsynlighedsfunktion:

hvor de tre variabelnavne betyder G = Græs vådt , S = Sprinkler og R = Regn .

Modellen kan besvare spørgsmål som "Hvad er sandsynligheden for, at det regnede, hvis græsset er vådt?" ved at bruge den betingede sandsynlighedsformel og summere variablerne:

Probabilistisk slutning

Fordi det bayesianske netværk er en komplet model for variabler og deres relationer, kan det bruges til at besvare sandsynlighedsspørgsmål. Netværket kan for eksempel bruges til at opnå ny viden om tilstanden af ​​en delmængde af variabler ved at observere andre variable ( evidensvariable ). Denne proces med at beregne den bageste fordeling af variable over evidensvariable kaldes probabilistisk inferens. Denne konsekvens giver os et universelt estimat for applikationer, hvor vi skal vælge værdierne af en delmængde af variabler, der minimerer tabsfunktionen, for eksempel sandsynligheden for en fejlagtig beslutning. Det Bayesianske netværk kan også opfattes som en mekanisme til automatisk at bygge en udvidelse af Bayes' sætning til mere komplekse problemer.

For at udføre probabilistisk inferens i Bayesianske netværk bruges følgende algoritmer [1] [3] :

Ansøgninger

Bayesianske netværk bruges til modellering inden for bioinformatik ( genetiske netværk , proteinstruktur ), medicin , dokumentklassificering , billedbehandling , databehandling , maskinlæring og beslutningsstøttesystemer .

Yderligere information

Gratis og open source-software

Kommercielle softwareprodukter

Se også

Noter

  1. 1 2 3 4 5 6 Judæa Perle. Kausalitet: Modeller, ræsonnement og slutning. - 2. udgave. - Cambridge University Press, 2009. - 464 s. — ISBN 9780521895606 .
  2. Adnan Darwiche. Modellering og ræsonnement med Bayesian Networks. - Cambridge University Press, 2009. - 526 s. — ISBN 978-0521884389 .
  3. Stuart Russell, Peter Norvig. Artificial Intelligence: A Modern Approach (AIMA): [oversat. fra engelsk]. - 2. udg. - M .: Williams, 2005. - 1424 s.

Links