P-værdi

P-værdi ( engelsk  P-værdi ) , p-signifikansniveau, p-kriterium - sandsynligheden for at opnå for en given probabilistisk model for fordelingen af ​​værdier af en stokastisk variabel den samme eller mere ekstreme værdi af statistik (aritmetisk middelværdi) , median osv.), sammenlignet med tidligere observeret, forudsat at nulhypotesen er sand.

Et træk ved P-værdier er deres ustabilitet på ækvivalente prøver , hvilket kan blive en hindring for reproducerbarheden af ​​de eksperimentelle resultater [1] [2] [3] . Alternativer til at bruge P-værdier omfatter metoder som scorestatistik og Bayes' koefficient [4] [5] [6] .

Formel definition og testprocedure

Lad være  en statistik , der bruges til at teste nogle nulhypoteser . Det antages, at hvis nulhypotesen er sand, så er fordelingen af ​​denne statistik kendt. Angiv fordelingsfunktionen . P-værdien er oftest (når man tester et højrehåndet alternativ) defineret som:

Når du tjekker det venstrehåndede alternativ,

I tilfælde af en tosidet test er p-værdien:

Hvis p(t) er mindre end det givne signifikansniveau, så forkastes nulhypotesen til fordel for den alternative. Ellers afvises det ikke.

Fordelen ved denne tilgang er, at det kan ses på hvilket signifikansniveau nulhypotesen vil blive forkastet, og ved hvilken den vil blive accepteret, det vil sige, at pålidelighedsniveauet af statistiske inferenser er synligt, mere præcist, sandsynligheden for fejl ved afvisning af nulhypotesen. På et hvilket som helst signifikansniveau større end nulhypotesen afvises, og ved lavere værdier er det ikke.

Kritik

Brugen af ​​p -værdier til at teste nulhypoteser i medicinsk og naturvidenskab er blevet kritiseret af mange eksperter. Det bemærkes, at deres brug ofte fører til fejl af den første art ( falsk positiv ) [7] . Især tidsskriftet Basic and Applied Social Psychology (BASP) forbød i 2015 fuldstændig publicering af artikler, der bruger p - værdier. Tidsskriftets redaktører forklarede dette med, at det ikke er særlig svært at gennemføre en undersøgelse, hvor en p < 0,05 opnås, og så lave p -værdier bliver alt for ofte en undskyldning for studier af lav kvalitet [8] .

Fejlfortolkning af P-værdier

Det er en udbredt opfattelse, at P-værdier ofte misfortolkes og misbruges [9] [10] [11] . En praksis, der er kommet under særlig kritik, er at acceptere en alternativ hypotese for enhver P-værdi, der er nominelt mindre end 0,05 uden andre underbyggende beviser. Mens P-værdier er nyttige til at vurdere, hvor inkonsistente data er med en given statistisk model, skal kontekstuelle faktorer såsom "studiedesign, målekvalitet, ekstern evidens for det undersøgte fænomen og soliditeten af ​​de forudsætninger, der ligger til grund for dataanalysen" også overvejes [11] . Et andet problem er, at P-værdien ofte misforstås som sandsynligheden for, at nulhypotesen er sand [11] [12] . Nogle eksperter har foreslået at erstatte P-værdier med alternative evidensmetrikker [11] såsom konfidensinterval [13] [14] , likelihood ratio [15] [16] eller Bayesiansk koefficient [17] [18] [19] , men den akutte diskussion om muligheden for at anvende sådanne alternativer [20] [21] . Andre har foreslået at fjerne faste signifikans-tærskler og fortolke P-værdier som kontinuerlige værdier, der karakteriserer mængden af ​​bevis mod sandsynligheden for nulhypotesen [22] [23] .

Se også

Noter

  1. Cumming, 2008 .
  2. Nuzzo, 2014 .
  3. Halsey, Curran-Everett, Vowler et al., 2015 .
  4. Cumming, 2010 .
  5. Taroni, Biedermann, Bozza, 2016 .
  6. Goodman, 2016 .
  7. Douglas H. Johnson. The Insignificance of Statistical Significance Testing  //  Journal of Wildlife Management . - Wiley-VCH , 1999. - Vol. 3 , nr. 63 . - s. 763-772 .
  8. Chris Woolston. Psykologitidsskrift forbyder P-værdier  (engelsk)  // Nature News. - 05-03-2015. — Bd. 519 , udg. 7541 . - S. 9-9 . - doi : 10.1038/519009f .
  9. Videnskabsmænd forstyrret af tab af statistisk værktøj til at sigte forskningsfudge fra fakta // Scientific American  : magazine  . - Springer Nature , 2015. - 16. april.  
  10. Goodman S.N. Mod evidensbaseret medicinsk statistik.  1: P -værdien fejlslutning  // Annals of Internal Medicine : journal. - 1999. - Bd. 130 , nr. 12 . - S. 995-1004 . - doi : 10.7326/0003-4819-130-12-199906150-00008 . — PMID 10383371 .
  11. 1 2 3 4 Wasserstein, Ronald L.; Lazar, Nicole A.ASA's udtalelse om p-værdier: kontekst, proces og formål  //  The American Statistician : journal. - 2016. - Bd. 70 . - S. 129-133 . - doi : 10.1080/00031305.2016.1154108 .
  12. Colquhoun, David. En undersøgelse af den falske opdagelsesrate og fejlfortolkningen af ​​p-værdier  //  Royal Society Open Science : journal. - 2014. - Bd. 1 . — S. 140216 . - doi : 10.1098/rsos.140216 .
  13. Lee, Dong Kyu. Alternativer til P-værdi: konfidensinterval og effektstørrelse  (engelsk)  // Korean Journal of Anesthesiology  : journal. - 2017. - 7. marts ( bd. 69 , nr. 6 ). - S. 555-562 . — ISSN 2005-6419 . - doi : 10.4097/kjae.2016.69.6.555 . — PMID 27924194 .
  14. Ranstam, J. Hvorfor P-værdikulturen er dårlig og konfidensintervaller et bedre alternativ  //  Slidgigt og brusk : journal. - 2012. - August ( bind 20 , nr. 8 ). - S. 805-808 . - doi : 10.1016/j.joca.2012.04.001 .
  15. Perneger, Thomas V. Sifting the evidence: Likelihood ratios are alternatives to P values ​ // BMJ  : British Medical Journal  : journal. - 2001. - 12. maj ( bd. 322 , nr. 7295 ). S. 1184 . ISSN 0959-8138 . PMID 11379590 .
  16. Royall, Richard. Sandsynlighedsparadigmet for statistisk evidens // Naturen af ​​videnskabelig evidens  . - S. 119-152. doi : 10.7208 /chicago/9780226789583.003.0005 .
  17. Schimmack, Ulrich Udskiftning af p-værdier med Bayes-faktorer: En mirakelkur mod replikabilitetskrisen i psykologisk videnskab . Replikerbarhedsindeks (30. april 2015). Hentet: 7. marts 2017.
  18. Marden, John I. Hypotesetestning: Fra p-værdier til Bayes-faktorer  //  Journal of the American Statistical Association  : tidsskrift. - 2000. - December ( bind 95 , nr. 452 ). — S. 1316 . - doi : 10.2307/2669779 .
  19. Stern, Hal S. En test med ethvert andet navn: værdier, Bayes-faktorer og statistisk inferens  //  Multivariat adfærdsforskning : journal. - 2016. - 16. februar ( bind 51 , nr. 1 ). - S. 23-29 . - doi : 10.1080/00273171.2015.1099032 . — PMID 26881954 .
  20. Murtaugh, Paul A. Til forsvar for p-værdier  (ubestemt)  // Økologi. - 2014. - Marts ( bd. 95 , nr. 3 ). - S. 611-617 . - doi : 10.1890/13-0590.1 .
  21. Aschwanden, Christie Statistikere fandt én ting, de kan blive enige om: Det er på tide at stoppe med at misbruge P-værdier . FiveThirtyEight (7. marts 2016).
  22. Amrhein, Valentin; Korner-Nievergelt, Francis; Roth, Tobias. Jorden er flad (p > 0,05): betydningstærskler og krisen med ikke-replikerbar forskning //  PeerJ   : journal. - 2017. - Bd. 5 . — P.e3544 . - doi : 10.7717/peerj.3544 .
  23. Amrhein, Valentin; Grønland, Sander. Fjern, i stedet for at omdefinere, statistisk signifikans  //  Nature Human Behavior : journal. - 2017. - Bd. 1 . — S. 0224 . - doi : 10.1038/s41562-017-0224-0 .

Litteratur

Links