Fishers nøjagtige test

Fishers eksakte test  er en statistisk signifikanstest , der bruges til analyse af krydstabuleringer for små stikprøvestørrelser . Relaterer til eksakte signifikanstest, da det ikke bruger store stikprøveapproksimationer (asymptotik, når prøvestørrelsen har en tendens til uendelig).

Opkaldt efter opfinderen - Ronald Fisher , blev skabelsen af ​​forfatteren foranlediget af udtalelsen fra Muriel Bristol ( eng.  Muriel Bristol ), som hævdede, at hun var i stand til at opdage, i hvilken rækkefølge te og mælk blev hældt i hendes kop.

Udnævnelse

Testen bruges almindeligvis til at undersøge betydningen af ​​sammenhængen mellem to variable i en faktoriel dimensionstabel ( kontingentabel ). Testsandsynlighedsværdien beregnes, som om værdierne ved tabellens grænser er kendte. For eksempel, i tilfælde af tesmagning, kender fru Bristol antallet af kopper med hver tilberedning (mælk eller te først), så angiveligt giver det korrekte antal gæt i hver kategori. Som påpeget af Fisher, forudsat nulhypotesen om testuafhængighed, fører dette til brug af en hypergeometrisk fordeling for en given score i tabellen.

Med store prøver kan chi-kvadrattesten bruges i denne situation . Denne test er imidlertid ikke passende, når middelværdien af ​​værdierne i nogen af ​​cellerne i tabellen med givne grænser er under 10: den beregnede stikprøvefordeling af den undersøgte statistik er kun omtrent lig med den teoretiske chi-kvadratfordeling , og tilnærmelsen er utilstrækkelig under disse forhold (som opstår, når prøverne er små, eller dataene er meget ulige fordelt mellem tabelcellerne). Fisher-testen er, som navnet antyder, nøjagtig og kan derfor bruges uanset prøvens karakteristika. Testen bliver svær at beregne for store prøver eller velafbalancerede tabeller, men heldigvis er det for disse forhold, at Pearson-kriteriet ( ) er velegnet.

For manuelle beregninger kan testen kun udføres i tilfælde af dimensionen af ​​faktortabeller . Princippet for testen kan dog udvides til det generelle tilfælde af tabeller , og nogle statistiske pakker giver sådanne beregninger (nogle gange ved at bruge en Monte Carlo-metode for at få en tilnærmelse).

Eksempel

Nøjagtige test giver dig mulighed for at få mere præcis analyse for små prøver eller data, der er sparsomme. Nøjagtige test af ikke-parametriske undersøgelser er et velegnet statistisk værktøj til at håndtere ubalancerede data. Ubalancerede data analyseret med asymptotiske metoder har en tendens til at føre til upålidelige resultater. For store og velafbalancerede datasæt er de nøjagtige og asymptotiske sandsynlighedsestimater meget ens. Men for små, sparsomme eller ubalancerede data kan de nøjagtige og asymptotiske estimater være ret forskellige og endda føre til modsatte konklusioner om hypotesen, der udvikles [1] [2] [3] .

Behovet for Fisher-testen opstår, når vi har data opdelt i to kategorier på to separate måder. For eksempel kan et udvalg af unge opdeles i kategorier på den ene side efter køn (drenge og piger), og på den anden side efter at være på diæt eller ej. Det kan antages, at andelen af ​​personer på diæt er højere blandt piger end blandt drenge, og vi ønsker at undersøge, om en observeret forskel i andele er statistisk signifikant.

Dataene kan se sådan ud:

unge mænd piger i alt
slankekure en 9 ti
ikke på diæt elleve 3 fjorten
i alt 12 12 24

Sådanne data er ikke egnede til chi-square-analyse, fordi de forventede værdier i tabellen altid er under 10, og antallet af frihedsgrader i faktorstørrelsestabellen altid er én.

Spørgsmålet, vi stiller om disse data, er: givet, at 10 ud af 24 teenagere er diætister, og at 12 af de 24 er piger, hvad er sandsynligheden for, at 10 diæter er så ulige fordelt mellem kønnene? Hvis vi tilfældigt skulle vælge 10 teenagere, hvad er sandsynligheden for, at 9 af dem blev trukket fra et sæt på 12 kvinder og kun 1 fra et sæt på 12 drenge?

Før vi fortsætter undersøgelsen af ​​Fisher-testen, lad os introducere den nødvendige notation. Lad os betegne tallene i cellerne med bogstaver , , og i overensstemmelse hermed kalde totalerne af summering af rækker og kolonner marginale (grænse) totaler og repræsentere totalen med bogstavet .

Nu ser tabellen således ud:

Unge piger i alt
Slankekure
Ikke på diæt
i alt

Fisher viste, at sandsynligheden for at opnå et sådant sæt af mængder er givet af den hypergeometriske fordeling:

hvor kolonnerne i parentes er de binomiale koefficienter , og symbolet " " er faktoroperatoren .

Denne formel giver den nøjagtige sandsynlighed for at observere ethvert specifikt sæt data givet de marginale resultater, totalen og nulhypotesen om den samme tilbøjelighed til diæt uanset køn (forholdet mellem diæterer og ikke-diætister er det samme for drenge som for piger).

Fisher viste, at vi kun kan behandle tilfælde, hvor de marginale  totaler er de samme som i tabellen ovenfor. I ovenstående eksempel er der 11 sådanne tilfælde. Af disse er kun én så "skæv" (i retning af en kvindelig tilbøjelighed til diæt) som demoen:

Unge piger i alt
Slankekure 0 ti ti
Ikke på diæt 12 2 fjorten
i alt 12 12 24

For at vurdere den statistiske signifikans af de observerede data, det vil sige den overordnede sandsynlighed for den samme eller mere udtalte "skævhed" over for piger på diæt, under forudsætning af nulhypotesen , skal vi beregne værdisandsynligheder for begge disse tabeller og tilføje dem. Dette giver den såkaldte en-halede test; til en tosidet test skal vi også overveje tabeller, der er tilsvarende skæve, men i den modsatte retning (det vil sige, overveje tilfældet med overvejende mandlig diæt).

At klassificere tabeller efter om de er "ekstremt skæve" er dog problematisk. Den tilgang, der anvendes af programmeringssproget R , foreslår at beregne kriterieværdien ved at summere sandsynligheden for alle tabeller med sandsynligheder mindre end eller lig med sandsynligheden for den observerede tabel. For tabeller med små celletal kan den to-halede testscore være væsentligt forskellig fra den dobbelte ensidede score, i modsætning til tilfældet med statistikker, der har en symmetrisk stikprøvefordeling.

De fleste moderne statistiske pakker beregner værdien af ​​Fisher-tests, i nogle tilfælde endda hvor en chi-kvadrat-tilnærmelse også ville være acceptabel. Faktiske beregninger udført af statistiske softwarepakker vil generelt afvige fra de beskrevne. Især kan numeriske vanskeligheder skyldes store factorials. Simple, men endnu mere effektive beregningsmetoder er baseret på brugen af ​​gammafunktionen eller den logaritmiske gammafunktion, men den nøjagtige beregning af hypergeometriske og binomiale sandsynligheder er et område af aktuel forskning.

Noter

  1. Mehta, CR 1995. SPSS 6.1 Præcis test til Windows. Englewood Cliffs, NJ: Prentice Hall
  2. Mehta, CR, Patel, NR, & Tsiatis, AA 1984. Præcis signifikanstest for at etablere behandlingsækvivalens med ordnede kategoriske data. Biometrics, 40(3), 819-825
  3. Mehta, CR, Patel, NR 1997. Præcis slutning i kategoriske data. Biometrics, 53(1), 112-117

Litteratur

Links