Wilcoxon test

Den aktuelle version af siden er endnu ikke blevet gennemgået af erfarne bidragydere og kan afvige væsentligt fra den version , der blev gennemgået den 25. oktober 2022; checks kræver 12 redigeringer .

Wilcoxon t-test - (også kaldet Wilcoxon t-test, Wilcoxon test, Wilcoxon signed rank test, Wilcoxon rank sum test) er en ikke-parametrisk statistisk test ( test ), der bruges til at teste for forskelle mellem to prøver af parrede eller uafhængige målinger ved niveauet af et hvilket som helst kvantitativt træk målt på en kontinuerlig eller ordinær skala. Først foreslået af Frank Wilcoxon [1] . Andre navne er Wilcoxons W-test [2] , Wilcoxons underskrevne rangtest , Wilcoxons tilsluttede prøvetest [3] . Wilcoxon-testen for uafhængige prøver kaldes også Mann-Whitney-testen [4] .

Essensen af metoden er, at de absolutte værdier af sværhedsgraden af skift i en eller anden retning sammenlignes. For at gøre dette rangeres først alle de absolutte værdier af skift, og derefter opsummeres rækkerne. Hvis skift i en eller anden retning sker ved et tilfælde, vil summen af deres rækker være omtrent lige store. Hvis intensiteten af skift i en retning er større, vil summen af rækkerne af de absolutte værdier af skift i den modsatte retning være betydeligt lavere, end den kunne være med tilfældige ændringer.

Formålet med kriteriet

Kriteriet er designet til at sammenligne indikatorer målt under to forskellige forhold på samme prøve af forsøgspersoner. Det giver dig mulighed for at etablere ikke kun retningen af ændringer, men også deres sværhedsgrad, det vil sige, det er i stand til at bestemme, om skiftet i indikatorer i den ene retning er mere intenst end i den anden.

Kriteriebeskrivelse

Kriteriet er anvendeligt, når attributterne er målt i det mindste på en ordensskala. Det er tilrådeligt at anvende dette kriterium, når størrelsen af selve skiftene varierer inden for et vist interval (10-15 % af deres størrelse). Dette forklares med, at spredningen af skiftværdier skal være sådan, at det bliver muligt at rangere dem. Hvis skiftene adskiller sig en smule fra hinanden og har nogle endelige værdier (for eksempel +1, -1 og 0), er der ingen formelle hindringer for anvendelsen af kriteriet, men på grund af det store antal identiske rækker , mister rangordningen sin betydning, og de samme resultater ville det være lettere at opnå ved brug af fortegnskriteriet.

Minimumsværdien af mængden: , hvor n er volumenet af den anden prøve. Den maksimale værdi af , hvor n er volumenet af den anden prøve, m er volumenet af den første prøve. $W=n(n+1)/2$ $W=n(n+1)/2+mn$

Kriterium restriktioner

Med sikkerhed kan Wilcoxon-testen bruges med en stikprøvestørrelse på op til 25 emner [5] . Dette forklares af det faktum, at fordelingen af værdierne af dette kriterium med et større antal observationer hurtigt nærmer sig normal. Derfor, i tilfælde af store prøver, tyr de til at konvertere Wilcoxon-testen til værdien af z (z-score) [5] . Det er bemærkelsesværdigt, at SPSS-programmet konverterer Wilcoson-testen til værdien af z altid uanset stikprøvestørrelser [5] .

Nulskift er udelukket fra overvejelse. (Dette krav kan omgås ved at omformulere typen af hypotese. For eksempel: skiftet mod stigende værdier overstiger skiftet mod deres fald og tendensen til at forblive på samme niveau.)

Et skift i den mere almindelige retning betragtes som "typisk" og omvendt.

Der er også en genvej til at sammenligne en enkelt prøve med en kendt medianværdi .

Algoritme

Lav en liste over emner i vilkårlig rækkefølge, f.eks. alfabetisk.
Beregn forskellen mellem de individuelle værdier i den anden og første måling. Bestem, hvad der vil blive betragtet som et typisk skift.
I henhold til rangeringsalgoritmen skal du rangordne de absolutte værdier af forskellene, tildele en lavere rang til den mindre værdi, og kontrollere sammenfaldet af den resulterende sum af ranger med den beregnede.
Marker på en eller anden måde de rækker, der svarer til skift i en atypisk retning. Beregn deres sum T.
Bestem de kritiske værdier af T for en given prøvestørrelse. Hvis T-emp. mindre end eller lig med T-cr. – skiftet til den "typiske" retning sejrer pålideligt.

Faktisk evalueres tegnene på værdierne opnået ved at trække en række værdier af en dimension fra en anden. Hvis antallet af reducerede værdier som et resultat er omtrent lig med antallet af øgede værdier, bekræftes nulmedianhypotesen .

Eksempel på en algoritme til en serie af to eksperimenter

Lad der være to serier af eksperimenter, som et resultat af hvilke to prøver af størrelse n og m blev opnået. Lad nulhypotesen H 0 : De generelle middelværdier for begge prøver er de samme. For at teste hypotesen H 0 er det nødvendigt:

Sum elementerne i den anden prøve (beregn W)
Beregn den matematiske forventning til en stokastisk variabel W. $M(W)=n(m+n+1)/2$
Hvis H 0 er sand, er den matematiske forventning af den stokastiske variabel W tæt på statistikken W.
Hypotesetestning begynder med valget af signifikansniveau - en
Beregn signifikansgrænserne (ud fra symmetrien er én grænse nok) og grænsen for det kritiske område W(a)
Gyldigheden af uligheden W > W(a) angiver gyldigheden af nulhypotesen. H 0 tages ved signifikansniveauet = a

Noter

↑ Wilcoxon, F. (1945). Individuelle sammenligninger efter rangordningsmetoder. Biometri, 1, 80-83.
↑ W Wilcoxon test . Hentet 10. december 2013. Arkiveret fra originalen 8. december 2013. (ubestemt)
↑ Wilcoxons test for forbundne prøver . Hentet 28. marts 2011. Arkiveret fra originalen 26. maj 2012. (ubestemt)
↑ Chris Wild. Wilcoxon Rank-Sum Test . CHANCE ENCOUNTERS: Et første kursus i dataanalyse og inferens . John Wiley & Sons, New York (1999). Hentet 7. september 2018. Arkiveret fra originalen 27. januar 2019. (ubestemt)
↑ 1 2 3 Graham Hole. Ikke-parametriske test med store stikprøvestørrelser . Hentet 21. april 2017. Arkiveret fra originalen 12. juli 2017. (ubestemt)