Bayesiansk netværk (eller Bayesiansk netværk , Bayesiansk trosnetværk , engelsk Bayesiansk netværk, trosnetværk ) - graf probabilistisk model , som er et sæt af variabler og deres probabilistiske afhængigheder ifølge Bayes . For eksempel kan et Bayesiansk netværk bruges til at beregne sandsynligheden for, at en patient har en sygdom baseret på tilstedeværelsen eller fraværet af et sæt af symptomer, baseret på data om sammenhængen mellem symptomer og sygdomme. Bayesianske netværks matematiske apparat blev skabt af den amerikanske videnskabsmand Judah Pearl , vinder af Turing Award (2011).
Formelt er et Bayesiansk netværk en rettet acyklisk graf , hvor hvert toppunkt svarer til en tilfældig variabel, og buerne på grafen koder for betingede uafhængighedsrelationer mellem disse variable. Hjørner kan repræsentere variabler af enhver type, være vægtede parametre, latente variabler eller hypoteser. Der er effektive metoder, der bruges til at beregne og træne Bayesianske netværk. Hvis de bayesianske netværksvariable er diskrete tilfældige variable, så kaldes et sådant netværk et diskret bayesiansk netværk. Bayesianske netværk, der modellerer sekvenser af variabler, kaldes dynamiske Bayesianske netværk . Bayesianske netværk, der kan have både diskrete og kontinuerte variabler, kaldes hybride Bayesianske netværk . Et bayesiansk netværk, hvor buerne udover betingede uafhængighedsrelationer også koder kausalitetsrelationer , kaldes kausale bayesianske netværk [ 1] ) .
Hvis en bue går fra et toppunkt til et toppunkt , så kaldes det en forælder og kaldes et barn . Hvis der er en rettet vej fra toppunktet til toppunktet , så kaldes det en forfader , og det kaldes en efterkommer .
Sættet af vertex-forældre til et toppunkt vil blive betegnet som .
En rettet acyklisk graf kaldes et Bayesiansk netværk for en sandsynlighedsfordeling defineret over et sæt af tilfældige variable , hvis hvert hjørne af grafen er forbundet med en tilfældig variabel fra , og buerne i grafen opfylder betingelsen (Markov betingelse [1] ): enhver variabel fra skal være betinget uafhængig af alle hjørner, der ikke er dens efterkommere, hvis alle dens direkte forældre i grafen , dvs.
retfærdig:
hvor er værdien ; - konfiguration[ angiv ] ; er mængden af alle toppunkter, der ikke er efterkommere af ; - konfiguration .
Derefter kan den komplette fælles fordeling af værdier ved toppunkterne bekvemt skrives som en nedbrydning (produkt) af lokale fordelinger:
Hvis et toppunkt ikke har nogen forfædre, kaldes dets lokale sandsynlighedsfordeling ubetinget , ellers betinget . Hvis et toppunkt - en tilfældig variabel har modtaget en værdi (for eksempel som følge af observation), så kaldes en sådan værdi bevis . Hvis værdien af variablen blev sat udefra (og ikke observeret), så kaldes en sådan værdi intervention ( engelsk handling ) eller intervention ( engelsk intervention ) [1] .
Betinget uafhængighed i et Bayesiansk netværk er repræsenteret af den grafiske egenskab af d-separation .
En sti kaldes et d -separeret eller blokeret toppunktsæt hvis og kun hvis
Lade være ikke-skærende delmængder af toppunkter i en acyklisk rettet graf . Et sæt toppunkter siges at være d-adskillende , hvis og kun hvis det blokerer alle stier fra ethvert toppunkt, der hører til ethvert toppunkt, der tilhører , og er betegnet med . En sti er en sekvens af på hinanden følgende kanter (i enhver retning) i grafen [1] .
For alle tre ikke-overlappende delmængder af hjørner i en acyklisk rettet graf og for alle sandsynlighedsfordelinger gælder følgende :
Med andre ord, hvis hjørnerne er d-adskilte, så er de betinget uafhængige; og hvis hjørnerne er betinget uafhængige i alle sandsynlighedsfordelinger, der er kompatible med grafen , så er de d-separerede [1] .
( betyder, at sæt af variabler og er betinget uafhængige for et givet sæt .)
Evidens - udsagn af formen "en hændelse fandt sted ved node x". For eksempel: "computeren vil ikke starte" .
Det Bayesianske netværk giver dig mulighed for at få svar på følgende typer af sandsynlighedsforespørgsler [2] :
Lad os antage, at der kan være to årsager til, at græsset kan blive vådt (GRASS WET): Sprinkleren har virket, eller det har regnet. Antag også, at regn påvirker driften af sprinkleren (under regn tænder enheden ikke). Så kan situationen modelleres af det illustrerede Bayesianske netværk. Hver af de tre variable kan kun tage én af to mulige værdier: T (sand - sand) og F (falsk - falsk), med de sandsynligheder, der er angivet i tabellerne i illustrationen.
Fælles sandsynlighedsfunktion:
hvor de tre variabelnavne betyder G = Græs vådt , S = Sprinkler og R = Regn .
Modellen kan besvare spørgsmål som "Hvad er sandsynligheden for, at det regnede, hvis græsset er vådt?" ved at bruge den betingede sandsynlighedsformel og summere variablerne:
Fordi det bayesianske netværk er en komplet model for variabler og deres relationer, kan det bruges til at besvare sandsynlighedsspørgsmål. Netværket kan for eksempel bruges til at opnå ny viden om tilstanden af en delmængde af variabler ved at observere andre variable ( evidensvariable ). Denne proces med at beregne den bageste fordeling af variable over evidensvariable kaldes probabilistisk inferens. Denne konsekvens giver os et universelt estimat for applikationer, hvor vi skal vælge værdierne af en delmængde af variabler, der minimerer tabsfunktionen, for eksempel sandsynligheden for en fejlagtig beslutning. Det Bayesianske netværk kan også opfattes som en mekanisme til automatisk at bygge en udvidelse af Bayes' sætning til mere komplekse problemer.
For at udføre probabilistisk inferens i Bayesianske netværk bruges følgende algoritmer [1] [3] :
Bayesianske netværk bruges til modellering inden for bioinformatik ( genetiske netværk , proteinstruktur ), medicin , dokumentklassificering , billedbehandling , databehandling , maskinlæring og beslutningsstøttesystemer .
Ordbøger og encyklopædier |
---|
Grafer sandsynlighedsmodeller | |
---|---|
|
Machine learning og data mining | |
---|---|
Opgaver | |
At lære med en lærer | |
klyngeanalyse | |
Dimensionalitetsreduktion | |
Strukturel prognose | |
Anomali detektion | |
Grafer sandsynlighedsmodeller | |
Neurale netværk | |
Forstærkende læring |
|
Teori | |
Tidsskrifter og konferencer |
|