Markov kæde

Den aktuelle version af siden er endnu ikke blevet gennemgået af erfarne bidragydere og kan afvige væsentligt fra den version , der blev gennemgået den 28. december 2019; checks kræver 9 redigeringer .

En Markov-kæde  er en sekvens af tilfældige hændelser med et begrænset eller tælleligt antal udfald , hvor sandsynligheden for, at hver hændelse indtræffer kun afhænger af tilstanden nået i den foregående hændelse [1] . Det er kendetegnet ved den egenskab, at fremtiden, løst sagt, med en fast nutid er uafhængig af fortiden. Opkaldt til ære for A. A. Markov (senior) , som først introducerede dette koncept i arbejdet i 1906. [2]

Diskret-tids Markov kæde

Definition

En sekvens af diskrete stokastiske variable kaldes en simpel Markov-kæde (med diskret tid) if

.

I det simpleste tilfælde afhænger den betingede fordeling af den næste tilstand af Markov-kæden kun af den aktuelle tilstand og afhænger ikke af alle tidligere tilstande (i modsætning til højere-ordens Markov-kæder).

Udvalget af tilfældige variable kaldes kædens tilstandsrum , og tallet  er trintallet.

Overgangsmatrix og homogene kæder

Matrix , hvor

kaldes matrixen af ​​overgangssandsynligheder på det -. trin, og vektoren , hvor

— den første distribution af Markov-kæden.

Det er klart, at overgangssandsynlighedsmatrixen er ret stokastisk , dvs.

.

En Markov-kæde kaldes homogen , hvis overgangssandsynlighedsmatrixen ikke afhænger af trintallet, dvs.

.

Ellers kaldes Markov-kæden inhomogen. I det følgende vil vi antage, at vi har at gøre med homogene Markov-kæder.

Finit-dimensionelle fordelinger og n-trins overgangsmatrix

Fra egenskaberne af betinget sandsynlighed og definitionen af ​​en homogen Markov-kæde får vi:

,

hvorfra det særlige tilfælde af Kolmogorov-Chapman-ligningen følger:

,

det vil sige, at matricen af ​​overgangssandsynligheder pr. trin i en homogen Markov-kæde er den -. grad af matricen af ​​overgangssandsynligheder pr. 1 trin. Langt om længe,

.

Tilstandstyper

Eksempler

Markov-kæde med kontinuerlig tid

Definition

En familie af diskrete stokastiske variable kaldes en Markov-kæde (med kontinuerlig tid) if

.

En Markov-kæde med kontinuerlig tid siges at være homogen if

.

Matrixen af ​​overgangsfunktioner og Kolmogorov-Chapman-ligningen

Som i tilfældet med diskret tid er de finit-dimensionelle fordelinger af en kontinuert-tidshomogen Markov-kæde fuldstændigt bestemt af den indledende fordeling

og matrixen af ​​overgangsfunktioner ( overgangssandsynligheder )

.

Matricen af ​​overgangssandsynligheder opfylder Kolmogorov-Chapman-ligningen : eller

Intensitetsmatrixen og Kolmogorovs differentialligninger

Per definition er intensitetsmatrixen eller tilsvarende,

.

To ligninger følger af Kolmogorov-Chapman-ligningen:

For begge ligninger er startbetingelsen valgt . Passende løsning

Egenskaber for matricerne P og Q

For enhver matrix har følgende egenskaber:

  1. Matrixelementer er ikke-negative: (ikke-negativitet af sandsynligheder).
  2. Summen af ​​elementerne i hver række er 1: (fuld sandsynlighed), det vil sige, at matrixen er højre-stokastisk (eller rækkevis).
  3. Alle matrix egenværdier overstiger ikke 1 i absolut værdi : . Hvis , så .
  4. Matrix-egenværdien svarer til mindst én ikke-negativ venstre egenvektor - række (ligevægt): .
  5. For en egenværdi af en matrix er alle rodvektorer egenvektorer, det vil sige, at de tilsvarende Jordan-celler er trivielle.

Matrixen har følgende egenskaber:

  1. Off- diagonale matrixelementer er ikke-negative: .
  2. Diagonale matrixelementer er ikke -positive: .
  3. Summen af ​​elementerne i hver række er 0:
  4. Den reelle del af alle matrixegenværdier er ikke -positiv: . Hvis , så
  5. Matrix-egenværdien svarer til mindst én ikke-negativ egenvektor i venstre række (ligevægt):
  6. For en egenværdi af en matrix er alle rodvektorer egenvektorer, det vil sige, at de tilsvarende Jordan-celler er trivielle.

Overgangsgraf, tilslutningsmuligheder og ergodiske Markov-kæder

For en Markov-kæde med kontinuerlig tid er en rettet overgangsgraf (kort sagt en overgangsgraf) konstrueret efter følgende regler:

De topologiske egenskaber af overgangsgrafen er relateret til matrixens spektrale egenskaber . Især gælder følgende sætninger for endelige Markov-kæder:

A. For hvilke som helst to forskellige hjørner af overgangsgrafen er der et sådant toppunkt på grafen ("common drain"), at der er orienterede stier fra toppunkt til toppunkt og fra toppunkt til toppunkt . Bemærk : mulig tilfælde eller ; i dette tilfælde betragtes en triviel (tom) vej fra til eller fra til også som en rettet vej. B. En nul egenværdi af en matrix er ikke degenereret. C. At , matricen tenderer til en matrix, hvor alle rækker falder sammen (og falder naturligvis sammen med ligevægtsfordelingen). A. Overgangsgrafen for en kæde er retningsmæssigt forbundet. B. En matrixs nulegenværdi er ikke degenereret og svarer til en strengt positiv venstre egenvektor (ligevægtsfordeling). B. For nogle er matrixen strengt taget positiv (det vil sige for alle ). D. For alle er matrixen strengt taget positiv. E. For , matricen har tendens til en strengt positiv matrix, hvor alle rækker falder sammen (og naturligvis falder sammen med ligevægtsfordelingen).

Eksempler

Overvej tre-stats Markov-kæder med kontinuerlig tid, svarende til overgangsgraferne vist i fig. I tilfælde (a) er kun de følgende off-diagonale elementer i intensitetsmatrixen ikke-nul , i tilfælde (b) er kun ikke-nul , og i tilfælde (c) er de . De resterende elementer bestemmes af matrixens egenskaber (summen af ​​elementerne i hver række er 0). Som et resultat, for graferne (a), (b), (c) ser intensitetsmatricerne ud som:

Grundlæggende kinetisk ligning

Den grundlæggende kinetiske ligning beskriver udviklingen af ​​sandsynlighedsfordelingen i en Markov-kæde med kontinuerlig tid. "Basic equation" her er ikke et epitet, men en oversættelse af det engelske udtryk.  master ligning . For rækkevektoren af ​​sandsynlighedsfordelingen har den grundlæggende kinetiske ligning formen:

og falder i det væsentlige sammen med den direkte Kolmogorov-ligning . I den fysiske litteratur bruges kolonnevektorer af sandsynligheder oftere, og den grundlæggende kinetiske ligning er skrevet i en form, der eksplicit bruger loven om bevarelse af total sandsynlighed:

hvor

Hvis der er en positiv ligevægt for den grundlæggende kinetiske ligning , så kan den skrives på formen

Lyapunov fungerer for den grundlæggende kinetiske ligning

For den kinetiske hovedligning er der en rig familie af konvekse Lyapunov  -funktioner - sandsynlighedsfordelingsfunktioner, der ændrer sig monotont med tiden. Lade være  en konveks funktion af en variabel. For enhver positiv sandsynlighedsfordeling ( ) definerer vi Morimoto-funktionen :

.

Den tidsafledede, hvis den opfylder den grundlæggende kinetiske ligning, er

.

Den sidste ulighed er gyldig på grund af konveksitet .

Eksempler på Morimotos funktioner
  • , ;
denne funktion er afstanden fra den aktuelle sandsynlighedsfordeling til ligevægtsin - normen . Tidsforskydning er en sammentrækning af rummet af sandsynlighedsfordelinger i denne norm. (For egenskaberne ved kontraktioner, se papiret Banach's Fixed Point Theorem .)
  • , ;
denne funktion er (minus) Kullback- entropien (se Kullback-Leibler distance ). I fysik svarer det til den frie energi divideret med (hvor  er Boltzmann-konstanten ,  er den absolutte temperatur ): if ( Boltzmann distribution ) så .
  • , ;
denne funktion er den frie energianalog af Burg-entropien, som er meget brugt i signalbehandling:
  • , ;
dette er en kvadratisk tilnærmelse for (minus) Kullback-entropien nær ligevægtspunktet. Op til et tidskonstant led er denne funktion den samme som (minus) Fisher-entropien givet ved følgende valg,
  • , ;
dette er (minus) Fisher-entropien .
  • , ;
dette er en af ​​analogerne til fri energi for Tsallis entropi . tjener som grundlag for den statistiske fysik af ikke-ekstensive mængder. Ved , tenderer den til den klassiske Boltzmann-Gibbs-Shannon-entropi, og den tilsvarende Morimoto-funktion har tendens til (minus) Kullback-entropien.

Praktisk anvendelse

En af de første videnskabelige discipliner, hvor Markov-kæder fandt praktisk anvendelse, var lingvistik (især tekstkritik ). Markov selv, for at illustrere sine resultater, studerede afhængigheden af ​​vekslen mellem vokaler og konsonanter i de første kapitler af " Eugene Onegin " og " Bagrov-barnebarns barndomsår " [3] .

Noter

  1. ↑ "Markov-kæden | Definition af Markov-kæden på amerikansk engelsk af Oxford Dictionaries"  . Oxford Ordbøger | Engelsk. . Lexico Ordbøger | Engelsk (14. december 2017). Hentet: 1. april 2020.
  2. Gagniuc, Paul A. Markov Chains: From Theory to Implementation and  Experimentation . - USA, NJ: John Wiley & Sons , 2017. - S. 2-8. — ISBN 978-1-119-38755-8 .
  3. Maistrov, L.E. Udvikling af begrebet sandsynlighed . - Nauka, 1980. - S. 188. - 269 s.

Litteratur

  • Kelbert M. Ya., Sukhov Yu. M. Sandsynlighed og statistik i eksempler og problemer. Vol. II: Markov-kæder som udgangspunkt for teorien om tilfældige processer og deres anvendelser. - M. : MTSNMO, 2010. - 295 s. — ISBN 978-5-94057-252-7 .
  • Markov A. A. , Udvidelse af loven om store tal til mængder, der afhænger af hinanden. - Nyheder om Fysik og Matematik Society ved Kazan University. - 2. serie. - Bind 15. (1906) - S. 135-156.
  • Markov-kæden  / A. V. Prokhorov // Great Russian Encyclopedia  : [i 35 bind]  / kap. udg. Yu. S. Osipov . - M .  : Great Russian Encyclopedia, 2004-2017.
  • Kemeny JG, Snell JL , Finite Markov-kæder. — Universitetsrækken i bachelor-matematik. Princeton: Van Nostrand, 1960
    • Oversættelse: Kemeny J.J. , Snell J.L. Finite Markov-kæder. — M.: Nauka. 1970. - 272 s.
  • Zhong Kai-lai Homogene Markov-kæder. Overs. fra engelsk. — M.: Mir, 1964. — 425 s.
  • E. Nummelin , Generelle irreducible Markov-kæder og ikke-negative operatører. — M.: Mir, 1989. — 207 s.
  • Morimoto T. , Markov processer og H-sætningen. — J. Phys. soc. Jap. 12 (1963), 328-331.
  • Yaglom A.M. , Yaglom I.M. , Sandsynlighed og information . - M., Nauka, 1973. - 512 s.
  • Kullback S. , Informationsteori og statistik. Wiley, New York, 1959.
  • Burg JP , Forholdet mellem maksimale entropispektre og maksimale sandsynlighedsspektre, Geophysics 37(2) (1972), 375-376.
  • Tsallis C. , Mulig generalisering af Boltzmann-Gibbs statistik. J. Stat. Phys. 52 (1988), 479-487.
  • Rudoy Yu. G. , Generaliseret informationsentropi og ikke-kanonisk fordeling i ligevægtsstatistisk mekanik , TMF, 135:1 (2003), 3-54.
  • Gorban, Alexander N.; Gorban, Pavel A.; Dommer, George. Entropi: The Markov Ordering Approach . Entropi 12, nr. 5 (2010), 1145-1193.

Links