Test af statistiske hypoteser

Den aktuelle version af siden er endnu ikke blevet gennemgået af erfarne bidragydere og kan afvige væsentligt fra den version , der blev gennemgået den 2. maj 2021; checks kræver 3 redigeringer .

Test af statistiske hypoteser  er indholdet af en af ​​matematisk statistiks store problemstillinger [1] .

Statistisk hypotese  - en hypotese om typen af ​​fordeling og egenskaber af en stokastisk variabel , som kan bekræftes eller afkræftes ved at anvende statistiske metoder til stikprøvedataene [1] .

Statistiske hypoteser

Definitioner

Antag, at i et (statistisk) eksperiment er en stokastisk variabel tilgængelig for observation , hvis fordeling er helt eller delvist ukendt. Så kaldes enhver udsagn om en statistisk hypotese . Hypoteser er kendetegnet ved den type antagelser, der er indeholdt i dem:

I praksis er det normalt nødvendigt at teste nogle specifikke og som regel simple hypoteser . En sådan hypotese kaldes nulhypotesen . Samtidig betragtes en hypotese, der modsiger den , kaldet en konkurrerende eller alternativ , parallelt .

Den fremsatte hypotese skal verificeres, hvilket udføres ved statistiske metoder, derfor kaldes hypotesen statistisk. For at teste en hypotese bruges kriterier til at acceptere eller afvise hypotesen.

I de fleste tilfælde er statistiske test baseret på en tilfældig stikprøve af en fast størrelse til distribution . Ved sekventiel analyse dannes prøven under selve eksperimentet, og derfor er dens størrelse en tilfældig variabel (se Sekventiel statistisk test ).

Eksempel

Lad en uafhængig stikprøve fra en normalfordeling gives , hvor  er en ukendt parameter. Så , hvor  er en fast konstant , er en simpel hypotese, og den, der konkurrerer med den,  er en kompleks.

Stadier af test af statistiske hypoteser

  1. Formulering af hovedhypotesen og konkurrerende hypotese .
  2. Indstilling af signifikansniveauet , ved hvilket i fremtiden konklusionen om hypotesens gyldighed vil blive lavet. Det er lig med sandsynligheden for at lave en type I fejl .
  3. Beregningen af ​​kriteriestatistikken er sådan, at:
    • dens værdi afhænger af den oprindelige prøve ;
    • ved dens værdi kan man drage slutninger om hypotesens sandhed ;
    • statistik , som en funktion af en tilfældig variabel , er også en tilfældig variabel og adlyder en form for distributionslov .
  4. Opbygning af den kritiske region. Fra rækken af ​​værdier skelnes der en delmængde af sådanne værdier, som kan bruges til at bedømme væsentlige uoverensstemmelser med antagelsen. Dens størrelse er valgt på en sådan måde, at ligestillingen holder . Dette sæt kaldes det kritiske område .
  5. Konklusion om sandheden af ​​hypotesen. De observerede værdier af stikprøven erstattes i statistikken , og ved at ramme (eller ikke ramme) det kritiske område , træffes en beslutning om at afvise (eller acceptere) den fremsatte hypotese .

Typer af kritisk region

Der er tre typer kritiske områder:

Se også

Noter

  1. 1 2 Ivanovsky R. Sandsynlighedsteori og matematisk statistik. Fundamentals, anvendte aspekter med eksempler og opgaver i Mathcad miljøet. — 528 s. - (Tutorial). - ISBN 978-5-9775-0199-6 .

Litteratur