Statistik nok

Den aktuelle version af siden er endnu ikke blevet gennemgået af erfarne bidragydere og kan afvige væsentligt fra den version , der blev gennemgået den 6. december 2021; verifikation kræver 1 redigering .

En tilstrækkelig statistik for en parameter, der definerer en bestemt familie af sandsynlighedsfordelinger,  er en statistik sådan, at den betingede sandsynlighed for stikprøven for en given værdi ikke afhænger af parameteren. Det vil sige, at ligheden er sand:

En tilstrækkelig statistik indeholder således al den information om parameteren , der kan fås fra stikprøven X . Derfor er begrebet tilstrækkelig statistik meget udbredt i parameterestimeringsteori .

Den enkleste tilstrækkelige statistik er selve stikprøven , men det, der er virkelig vigtigt, er de tilfælde, hvor dimensionen af ​​den tilstrækkelige statistik er meget mindre end dimensionen af ​​stikprøven, især når den tilstrækkelige statistik kun udtrykkes med nogle få tal.

En tilstrækkelig statistik siges at være minimal nok, hvis der for hver tilstrækkelig statistik T eksisterer en ikke-tilfældig målbar funktion g , som er næsten overalt .

Faktoriseringssætning

Faktoriseringssætningen giver en praktisk måde at finde tilstrækkelig statistik til en sandsynlighedsfordeling. Det giver tilstrækkelige og nødvendige betingelser for statistikkens tilstrækkelighed, og påstanden om sætninger bruges nogle gange som en definition.

Lad være  nogle statistikker, og  være en betinget tæthedsfunktion eller en sandsynlighedsfunktion (afhængigt af typen af ​​fordeling) for observationsvektoren X . Så er en tilstrækkelig statistik for parameteren, hvis og kun hvis der er sådanne målbare funktioner, og at vi kan skrive:

Bevis

Nedenfor er beviset for det særlige tilfælde, hvor sandsynlighedsfordelingen er diskret . Derefter  — Sandsynlighedsfunktion .

Lad den givne funktion have en faktorisering, som i sætningens udsagn, og

Så har vi:

Af dette ser vi, at den betingede sandsynlighed for vektoren X for en given værdi af statistikken ikke afhænger af parameteren og derfor  er en tilstrækkelig statistik.

Omvendt kan vi skrive:

Ud fra ovenstående har vi, at den første faktor på højre side ikke afhænger af parameteren og kan tages som en funktion fra formuleringen af ​​sætningen. Den anden faktor er en funktion af og og kan tages som en funktion.Dermed opnås den nødvendige dekomponering, som fuldender beviset for sætningen.

Eksempler

Bernoulli distribution

Lade være  en sekvens af tilfældige variable , der er lig med 1 med sandsynlighed og lig med 0 med sandsynlighed (det vil sige, de har en Bernoulli-fordeling ). Derefter

hvis du tager

Så er denne statistik tilstrækkelig ifølge faktoriseringssætningen, hvis vi betegner

Poisson distribution

Lade være  en sekvens af stokastiske variable med Poisson-fordelingen . Derefter


hvor

Denne statistik er tilstrækkelig ifølge faktoriseringssætningen, hvis vi betegner

Ensartet fordeling

Lade være  en sekvens af ensartet fordelte stokastiske variable . Ad hoc

Det følger heraf, at statistikken er tilstrækkelig.

Normalfordeling

For stokastiske variable med en normalfordeling ville en tilstrækkelig statistik være

Egenskaber

desuden opnås lighed kun, når er en målbar funktion af T . ( Rao-Blackwell-Kolmogorov-sætning )

Se også

Litteratur