Test af statistiske hypoteser
Den aktuelle version af siden er endnu ikke blevet gennemgået af erfarne bidragydere og kan afvige væsentligt fra den
version , der blev gennemgået den 2. maj 2021; checks kræver
3 redigeringer .
Test af statistiske hypoteser er indholdet af en af matematisk statistiks store problemstillinger [1] .
Statistisk hypotese - en hypotese om typen af fordeling og egenskaber af en stokastisk variabel , som kan bekræftes eller afkræftes ved at anvende statistiske metoder til stikprøvedataene [1] .
Statistiske hypoteser
Definitioner
Antag, at i et (statistisk) eksperiment er en stokastisk variabel tilgængelig for observation , hvis fordeling er helt eller delvist ukendt. Så kaldes enhver udsagn om en statistisk hypotese . Hypoteser er kendetegnet ved den type antagelser, der er indeholdt i dem:
- En statistisk hypotese, der entydigt bestemmer fordelingen , det vil sige hvor er en bestemt lov, kaldes simpel .
- En statistisk hypotese, der siger, at en fordeling tilhører en bestemt familie af fordelinger, det vil sige af formen , hvor er en familie af fordelinger, kaldes kompleks .
I praksis er det normalt nødvendigt at teste nogle specifikke og som regel simple hypoteser . En sådan hypotese kaldes nulhypotesen . Samtidig betragtes en hypotese, der modsiger den , kaldet en konkurrerende eller alternativ , parallelt .
Den fremsatte hypotese skal verificeres, hvilket udføres ved statistiske metoder, derfor kaldes hypotesen statistisk. For at teste en hypotese bruges kriterier til at acceptere eller afvise hypotesen.
I de fleste tilfælde er statistiske test baseret på en tilfældig stikprøve af en fast størrelse til distribution . Ved sekventiel analyse dannes prøven under selve eksperimentet, og derfor er dens størrelse en tilfældig variabel (se Sekventiel statistisk test ).
Eksempel
Lad en uafhængig stikprøve fra en normalfordeling gives , hvor er en ukendt parameter. Så , hvor er en fast konstant , er en simpel hypotese, og den, der konkurrerer med den, er en kompleks.
Stadier af test af statistiske hypoteser
- Formulering af hovedhypotesen og konkurrerende hypotese .
- Indstilling af signifikansniveauet , ved hvilket i fremtiden konklusionen om hypotesens gyldighed vil blive lavet. Det er lig med sandsynligheden for at lave en type I fejl .
- Beregningen af kriteriestatistikken er sådan, at:
- dens værdi afhænger af den oprindelige prøve ;
- ved dens værdi kan man drage slutninger om hypotesens sandhed ;
- statistik , som en funktion af en tilfældig variabel , er også en tilfældig variabel og adlyder en form for distributionslov .
- Opbygning af den kritiske region. Fra rækken af værdier skelnes der en delmængde af sådanne værdier, som kan bruges til at bedømme væsentlige uoverensstemmelser med antagelsen. Dens størrelse er valgt på en sådan måde, at ligestillingen holder . Dette sæt kaldes det kritiske område .
- Konklusion om sandheden af hypotesen. De observerede værdier af stikprøven erstattes i statistikken , og ved at ramme (eller ikke ramme) det kritiske område , træffes en beslutning om at afvise (eller acceptere) den fremsatte hypotese .
Typer af kritisk region
Der er tre typer kritiske områder:
- Den tosidede kritiske region er defineret af to intervaller , hvor findes fra betingelserne .
- Den venstre kritiske region bestemmes af intervallet , hvor findes fra tilstanden .
- Den højre kritiske region bestemmes af intervallet , hvor findes fra tilstanden .
Se også
Noter
- ↑ 1 2 Ivanovsky R. Sandsynlighedsteori og matematisk statistik. Fundamentals, anvendte aspekter med eksempler og opgaver i Mathcad miljøet. — 528 s. - (Tutorial). - ISBN 978-5-9775-0199-6 .
Litteratur
Ordbøger og encyklopædier |
|
---|
I bibliografiske kataloger |
|
---|