En tilstrækkelig statistik for en parameter, der definerer en bestemt familie af sandsynlighedsfordelinger, er en statistik sådan, at den betingede sandsynlighed for stikprøven for en given værdi ikke afhænger af parameteren. Det vil sige, at ligheden er sand:
En tilstrækkelig statistik indeholder således al den information om parameteren , der kan fås fra stikprøven X . Derfor er begrebet tilstrækkelig statistik meget udbredt i parameterestimeringsteori .
Den enkleste tilstrækkelige statistik er selve stikprøven , men det, der er virkelig vigtigt, er de tilfælde, hvor dimensionen af den tilstrækkelige statistik er meget mindre end dimensionen af stikprøven, især når den tilstrækkelige statistik kun udtrykkes med nogle få tal.
En tilstrækkelig statistik siges at være minimal nok, hvis der for hver tilstrækkelig statistik T eksisterer en ikke-tilfældig målbar funktion g , som er næsten overalt .
Faktoriseringssætningen giver en praktisk måde at finde tilstrækkelig statistik til en sandsynlighedsfordeling. Det giver tilstrækkelige og nødvendige betingelser for statistikkens tilstrækkelighed, og påstanden om sætninger bruges nogle gange som en definition.
Lad være nogle statistikker, og være en betinget tæthedsfunktion eller en sandsynlighedsfunktion (afhængigt af typen af fordeling) for observationsvektoren X . Så er en tilstrækkelig statistik for parameteren, hvis og kun hvis der er sådanne målbare funktioner, og at vi kan skrive:
Nedenfor er beviset for det særlige tilfælde, hvor sandsynlighedsfordelingen er diskret . Derefter — Sandsynlighedsfunktion .
Lad den givne funktion have en faktorisering, som i sætningens udsagn, og
Så har vi:
Af dette ser vi, at den betingede sandsynlighed for vektoren X for en given værdi af statistikken ikke afhænger af parameteren og derfor er en tilstrækkelig statistik.
Omvendt kan vi skrive:
Ud fra ovenstående har vi, at den første faktor på højre side ikke afhænger af parameteren og kan tages som en funktion fra formuleringen af sætningen. Den anden faktor er en funktion af og og kan tages som en funktion.Dermed opnås den nødvendige dekomponering, som fuldender beviset for sætningen.
Lade være en sekvens af tilfældige variable , der er lig med 1 med sandsynlighed og lig med 0 med sandsynlighed (det vil sige, de har en Bernoulli-fordeling ). Derefter
hvis du tager
Så er denne statistik tilstrækkelig ifølge faktoriseringssætningen, hvis vi betegner
Lade være en sekvens af stokastiske variable med Poisson-fordelingen . Derefter
hvor
Denne statistik er tilstrækkelig ifølge faktoriseringssætningen, hvis vi betegner
Lade være en sekvens af ensartet fordelte stokastiske variable . Ad hoc
Det følger heraf, at statistikken er tilstrækkelig.
For stokastiske variable med en normalfordeling ville en tilstrækkelig statistik være
Ordbøger og encyklopædier |
---|