Markov kæde
Den aktuelle version af siden er endnu ikke blevet gennemgået af erfarne bidragydere og kan afvige væsentligt fra den
version , der blev gennemgået den 28. december 2019; checks kræver
9 redigeringer .
En Markov-kæde er en sekvens af tilfældige hændelser med et begrænset eller tælleligt antal udfald , hvor sandsynligheden for, at hver hændelse indtræffer kun afhænger af tilstanden nået i den foregående hændelse [1] . Det er kendetegnet ved den egenskab, at fremtiden, løst sagt, med en fast nutid er uafhængig af fortiden. Opkaldt til ære for A. A. Markov (senior) , som først introducerede dette koncept i arbejdet i 1906. [2]
Diskret-tids Markov kæde
Definition
En sekvens af diskrete stokastiske variable kaldes en simpel Markov-kæde (med diskret tid) if
.
I det simpleste tilfælde afhænger den betingede fordeling af den næste tilstand af Markov-kæden kun af den aktuelle tilstand og afhænger ikke af alle tidligere tilstande (i modsætning til højere-ordens Markov-kæder).
Udvalget af tilfældige variable kaldes kædens tilstandsrum , og tallet er trintallet.
Overgangsmatrix og homogene kæder
Matrix , hvor
kaldes matrixen af overgangssandsynligheder på det -. trin, og vektoren , hvor
— den første distribution af Markov-kæden.
Det er klart, at overgangssandsynlighedsmatrixen er ret stokastisk , dvs.
.
En Markov-kæde kaldes homogen , hvis overgangssandsynlighedsmatrixen ikke afhænger af trintallet, dvs.
.
Ellers kaldes Markov-kæden inhomogen. I det følgende vil vi antage, at vi har at gøre med homogene Markov-kæder.
Finit-dimensionelle fordelinger og n-trins overgangsmatrix
Fra egenskaberne af betinget sandsynlighed og definitionen af en homogen Markov-kæde får vi:
,
hvorfra det særlige tilfælde af Kolmogorov-Chapman-ligningen følger:
,
det vil sige, at matricen af overgangssandsynligheder pr. trin i en homogen Markov-kæde er den -. grad af matricen af overgangssandsynligheder pr. 1 trin. Langt om længe,
.
Tilstandstyper
Eksempler
Markov-kæde med kontinuerlig tid
Definition
En familie af diskrete stokastiske variable kaldes en Markov-kæde (med kontinuerlig tid) if
.
En Markov-kæde med kontinuerlig tid siges at være homogen if
.
Matrixen af overgangsfunktioner og Kolmogorov-Chapman-ligningen
Som i tilfældet med diskret tid er de finit-dimensionelle fordelinger af en kontinuert-tidshomogen Markov-kæde fuldstændigt bestemt af den indledende fordeling
og matrixen af overgangsfunktioner ( overgangssandsynligheder )
.
Matricen af overgangssandsynligheder opfylder Kolmogorov-Chapman-ligningen : eller
Intensitetsmatrixen og Kolmogorovs differentialligninger
Per definition er intensitetsmatrixen eller tilsvarende,
.
To ligninger følger af Kolmogorov-Chapman-ligningen:
For begge ligninger er startbetingelsen valgt . Passende løsning
Egenskaber for matricerne P og Q
For enhver matrix har følgende egenskaber:
- Matrixelementer er ikke-negative: (ikke-negativitet af sandsynligheder).
- Summen af elementerne i hver række er 1: (fuld sandsynlighed), det vil sige, at matrixen er højre-stokastisk (eller rækkevis).
- Alle matrix egenværdier overstiger ikke 1 i absolut værdi : . Hvis , så .
- Matrix-egenværdien svarer til mindst én ikke-negativ venstre egenvektor - række (ligevægt): .
- For en egenværdi af en matrix er alle rodvektorer egenvektorer, det vil sige, at de tilsvarende Jordan-celler er trivielle.
Matrixen har følgende egenskaber:
- Off- diagonale matrixelementer er ikke-negative: .
- Diagonale matrixelementer er ikke -positive: .
- Summen af elementerne i hver række er 0:
- Den reelle del af alle matrixegenværdier er ikke -positiv: . Hvis , så
- Matrix-egenværdien svarer til mindst én ikke-negativ egenvektor i venstre række (ligevægt):
- For en egenværdi af en matrix er alle rodvektorer egenvektorer, det vil sige, at de tilsvarende Jordan-celler er trivielle.
Overgangsgraf, tilslutningsmuligheder og ergodiske Markov-kæder
For en Markov-kæde med kontinuerlig tid er en rettet overgangsgraf (kort sagt en overgangsgraf) konstrueret efter følgende regler:
- Sættet af grafens hjørnepunkter falder sammen med sættet af kædetilstande.
- Hjørnerne er forbundet med en orienteret kant , hvis (det vil sige intensiteten af flowet fra -th tilstand til -th er positiv).
De topologiske egenskaber af overgangsgrafen er relateret til matrixens spektrale egenskaber . Især gælder følgende sætninger for endelige Markov-kæder:
- De følgende tre egenskaber A, B, C af en endelig Markov-kæde er ækvivalente (kæder, der besidder dem, kaldes nogle gange svagt ergodiske ):
A. For hvilke som helst to forskellige hjørner af overgangsgrafen er der et sådant toppunkt på grafen ("common drain"), at der er orienterede stier fra toppunkt til toppunkt og fra toppunkt til toppunkt . Bemærk : mulig tilfælde eller ; i dette tilfælde betragtes en triviel (tom) vej fra til eller fra til også som en rettet vej.
B. En nul egenværdi af en matrix er ikke degenereret.
C. At , matricen tenderer til en matrix, hvor alle rækker falder sammen (og falder naturligvis sammen med ligevægtsfordelingen).
- De følgende fem egenskaber A, B, C, D, D af en endelig Markov-kæde er ækvivalente (kæder, der besidder dem, kaldes ergodiske ):
A. Overgangsgrafen for en kæde er retningsmæssigt forbundet.
B. En matrixs nulegenværdi er ikke degenereret og svarer til en strengt positiv venstre egenvektor (ligevægtsfordeling).
B. For nogle er matrixen strengt taget positiv (det vil sige for alle ).
D. For alle er matrixen strengt taget positiv.
E. For , matricen har tendens til en strengt positiv matrix, hvor alle rækker falder sammen (og naturligvis falder sammen med ligevægtsfordelingen).
Eksempler
Overvej tre-stats Markov-kæder med kontinuerlig tid, svarende til overgangsgraferne vist i fig. I tilfælde (a) er kun de følgende off-diagonale elementer i intensitetsmatrixen ikke-nul , i tilfælde (b) er kun ikke-nul , og i tilfælde (c) er de . De resterende elementer bestemmes af matrixens egenskaber (summen af elementerne i hver række er 0). Som et resultat, for graferne (a), (b), (c) ser intensitetsmatricerne ud som:
Grundlæggende kinetisk ligning
Den grundlæggende kinetiske ligning beskriver udviklingen af sandsynlighedsfordelingen i en Markov-kæde med kontinuerlig tid. "Basic equation" her er ikke et epitet, men en oversættelse af det engelske udtryk. master ligning . For rækkevektoren af sandsynlighedsfordelingen har den grundlæggende kinetiske ligning formen:
og falder i det væsentlige sammen med den direkte Kolmogorov-ligning . I den fysiske litteratur bruges kolonnevektorer af sandsynligheder oftere, og den grundlæggende kinetiske ligning er skrevet i en form, der eksplicit bruger loven om bevarelse af total sandsynlighed:
hvor
Hvis der er en positiv ligevægt for den grundlæggende kinetiske ligning , så kan den skrives på formen
Lyapunov fungerer for den grundlæggende kinetiske ligning
For den kinetiske hovedligning er der en rig familie af konvekse Lyapunov -funktioner - sandsynlighedsfordelingsfunktioner, der ændrer sig monotont med tiden. Lade være en konveks funktion af en variabel. For enhver positiv sandsynlighedsfordeling ( ) definerer vi Morimoto-funktionen :
.
Den tidsafledede, hvis den opfylder den grundlæggende kinetiske ligning, er
.
Den sidste ulighed er gyldig på grund af konveksitet .
Eksempler på Morimotos funktioner
- , ;
denne funktion er afstanden fra den aktuelle sandsynlighedsfordeling til ligevægtsin -
normen . Tidsforskydning er en sammentrækning af rummet af sandsynlighedsfordelinger i denne norm. (For egenskaberne ved kontraktioner, se papiret
Banach's Fixed Point Theorem .)
- , ;
denne funktion er (minus) Kullback-
entropien (se
Kullback-Leibler distance ). I fysik svarer det til den
frie energi divideret med (hvor er
Boltzmann-konstanten , er den absolutte
temperatur ):
if (
Boltzmann distribution ) så
.
- , ;
denne funktion er den frie energianalog af Burg-entropien, som er meget brugt i signalbehandling:
- , ;
dette er en kvadratisk tilnærmelse for (minus) Kullback-entropien nær ligevægtspunktet. Op til et tidskonstant led er denne funktion den samme som (minus) Fisher-entropien givet ved følgende valg,
- , ;
dette er (minus)
Fisher-entropien .
- , ;
dette er en af analogerne til fri energi for
Tsallis entropi .
tjener som grundlag for den statistiske fysik af ikke-ekstensive mængder. Ved , tenderer den til den klassiske Boltzmann-Gibbs-Shannon-entropi, og den tilsvarende Morimoto-funktion har tendens til (minus) Kullback-entropien.
Praktisk anvendelse
En af de første videnskabelige discipliner, hvor Markov-kæder fandt praktisk anvendelse, var lingvistik (især tekstkritik ). Markov selv, for at illustrere sine resultater, studerede afhængigheden af vekslen mellem vokaler og konsonanter i de første kapitler af " Eugene Onegin " og " Bagrov-barnebarns barndomsår " [3] .
Noter
- ↑ "Markov-kæden | Definition af Markov-kæden på amerikansk engelsk af Oxford Dictionaries" . Oxford Ordbøger | Engelsk. . Lexico Ordbøger | Engelsk (14. december 2017). Hentet: 1. april 2020.
- ↑ Gagniuc, Paul A. Markov Chains: From Theory to Implementation and Experimentation . - USA, NJ: John Wiley & Sons , 2017. - S. 2-8. — ISBN 978-1-119-38755-8 .
- ↑ Maistrov, L.E. Udvikling af begrebet sandsynlighed . - Nauka, 1980. - S. 188. - 269 s.
Litteratur
- Kelbert M. Ya., Sukhov Yu. M. Sandsynlighed og statistik i eksempler og problemer. Vol. II: Markov-kæder som udgangspunkt for teorien om tilfældige processer og deres anvendelser. - M. : MTSNMO, 2010. - 295 s. — ISBN 978-5-94057-252-7 .
- Markov A. A. , Udvidelse af loven om store tal til mængder, der afhænger af hinanden. - Nyheder om Fysik og Matematik Society ved Kazan University. - 2. serie. - Bind 15. (1906) - S. 135-156.
- Markov-kæden / A. V. Prokhorov // Great Russian Encyclopedia : [i 35 bind] / kap. udg. Yu. S. Osipov . - M . : Great Russian Encyclopedia, 2004-2017.
- Kemeny JG, Snell JL , Finite Markov-kæder. — Universitetsrækken i bachelor-matematik. Princeton: Van Nostrand, 1960
- Oversættelse: Kemeny J.J. , Snell J.L. Finite Markov-kæder. — M.: Nauka. 1970. - 272 s.
- Zhong Kai-lai Homogene Markov-kæder. Overs. fra engelsk. — M.: Mir, 1964. — 425 s.
- E. Nummelin , Generelle irreducible Markov-kæder og ikke-negative operatører. — M.: Mir, 1989. — 207 s.
- Morimoto T. , Markov processer og H-sætningen. — J. Phys. soc. Jap. 12 (1963), 328-331.
- Yaglom A.M. , Yaglom I.M. , Sandsynlighed og information . - M., Nauka, 1973. - 512 s.
- Kullback S. , Informationsteori og statistik. Wiley, New York, 1959.
- Burg JP , Forholdet mellem maksimale entropispektre og maksimale sandsynlighedsspektre, Geophysics 37(2) (1972), 375-376.
- Tsallis C. , Mulig generalisering af Boltzmann-Gibbs statistik. J. Stat. Phys. 52 (1988), 479-487.
- Rudoy Yu. G. , Generaliseret informationsentropi og ikke-kanonisk fordeling i ligevægtsstatistisk mekanik , TMF, 135:1 (2003), 3-54.
- Gorban, Alexander N.; Gorban, Pavel A.; Dommer, George. Entropi: The Markov Ordering Approach . Entropi 12, nr. 5 (2010), 1145-1193.
Links
Ordbøger og encyklopædier |
|
---|
I bibliografiske kataloger |
|
---|
Typer af kunstige neurale netværk |
---|
|