Pearsons godhed-of-fit-test

Den aktuelle version af siden er endnu ikke blevet gennemgået af erfarne bidragydere og kan afvige væsentligt fra den version , der blev gennemgået den 9. november 2021; verifikation kræver 1 redigering .

Pearson's goodness -of-fit test eller goodness -of-fit test (chi-square)  er en ikke-parametrisk metode, der giver dig mulighed for at vurdere betydningen af ​​forskelle mellem det faktiske (afsløret som et resultat af undersøgelsen) antal resultater eller kvalitative karakteristika for stikprøven, der falder ind under hver kategori, og det teoretiske antal, der kan forventes i de undersøgte grupper, hvis nulhypotesen er sand. I enklere vendinger giver metoden dig mulighed for at evaluere den statistiske signifikans af forskelle mellem to eller flere relative indikatorer (frekvenser, andele).

Det er det mest almindeligt anvendte kriterium til at teste hypotesen om, at den observerede stikprøvestørrelse tilhører en eller anden teoretisk distributionslov .

Chi-kvadrat-kriteriet for analyse af beredskabstabeller blev udviklet og foreslået i 1900 af grundlæggeren af ​​matematisk statistik , den engelske videnskabsmand Karl Pearson .

Kriteriet kan bruges til at teste simple hypoteser om formen

hvor  er den kendte vektor af parametre for den teoretiske lov, og når man tester komplekse hypoteser af formen

når et estimat af en skalar- eller vektorfordelingsparameter beregnes over den samme prøve.

Kriteriestatistik

Proceduren for test af hypoteser ved hjælp af typekriterier involverer gruppering af observationer. Definitionsdomænet for en stokastisk variabel er opdelt i ikke-skærende intervaller af grænsepunkter

hvor  er den nedre grænse for definitionsdomænet for en stokastisk variabel;  - øverste kant.

I overensstemmelse med den givne partition beregnes antallet af prøveværdier, der falder ind i det th interval og sandsynligheden for at falde ind i intervallet

svarende til en teoretisk lov med fordelingsfunktion

Hvori

og

Når man tester en simpel hypotese, er både lovens form og alle dens parametre kendt (skalar- eller vektorparameteren er kendt ).

Statistikken, der anvendes i typens goodness-of-fit-test, er baseret på måling af afvigelser fra .

Pearson goodness-of-fit-statistikken bestemmes af relationen

I tilfælde af at teste en simpel hypotese, i grænsen ved , adlyder denne statistik en -fordeling med frihedsgrader, hvis den testede hypotese er sand . Tætheden af ​​-fordelingen, som er et særligt tilfælde af gammafordelingen , er beskrevet af formlen

Den testede hypotese afvises for store værdier af statistikken, når værdien af ​​statistikken beregnet ud fra stikprøven er større end den kritiske værdi

eller det opnåede signifikansniveau ( p - værdi ) er mindre end det givne signifikansniveau (den givne fejlsandsynlighed af 1. art ) .

Test af komplekse hypoteser

Ved testning af komplekse hypoteser, hvis lovens parametre for den samme prøve er estimeret som et resultat af minimering af statistik eller for en grupperet prøve ved brug af maksimumsandsynlighedsmetoden , så adlyder statistikken , hvis den testede hypotese er sand, en -fordeling med frihedsgrader, hvor  er antallet af parametre estimeret fra stikprøven.

Hvis parametrene estimeres ud fra den oprindelige ugrupperede stikprøve, vil fordelingen af ​​statistikken ikke være en -fordeling [1] . Desuden vil fordelingen af ​​statistik, når hypotesen er sand , afhænge af grupperingsmetoden, det vil sige, hvordan definitionsdomænet er opdelt i intervaller [2] .

Når du estimerer den maksimale sandsynlighedsmetode for parametre for en ikke-grupperet prøve, kan du bruge modificerede kriterier som [3] [4] [5] [6] .

På kraften af ​​kriteriet

Ved brug af godhedskriterier opstilles der som regel ingen konkurrerende hypoteser: stikprøven tilhører en bestemt lov, og som en konkurrerende hypotese betragtes enhver anden lov. Naturligvis vil kriteriet være i stand til på forskellige måder at skelne fra den tilsvarende lov, love tæt på eller langt fra den. Hvis vi specificerer en konkurrerende hypotese og en konkurrerende lov, der svarer til den , så kan vi allerede tale om fejl af to typer: ikke kun om en fejl af 1. slags (afvisning af hypotesen, der testes, når den er sand) og sandsynligheden for denne fejl , men også om en fejl af 2. art (ikke-afvisning under rimelighed ) og sandsynligheden for denne fejl .

Kriteriets magt i forhold til den konkurrerende hypotese er karakteriseret ved værdien . Jo bedre kriteriet genkender et par konkurrerende hypoteser og , jo højere er dets styrke.

Styrken af ​​Pearsons godhed-of-fit test afhænger væsentligt af metoden til gruppering [7] [8] og af det valgte antal intervaller [8] [9] .

Under asymptotisk optimal gruppering, som maksimerer forskellige funktioner i Fisher-informationsmatrixen over de grupperede data (minimerer tabene forbundet med gruppering), har Pearson goodness-of-fit-testen den maksimale styrke i forhold til "(meget) tætte" konkurrerende hypoteser [ 10] [8] [9] .

Når man tester simple hypoteser og bruger asymptotisk optimal gruppering, har Pearsons goodness-of-fit-test en magtfordel i forhold til ikke-parametriske goodness-of-fit-tests. Når man tester komplekse hypoteser, øges styrken af ​​ikke-parametriske kriterier, og der er ingen sådan fordel [11] [12] . For ethvert par af konkurrerende hypoteser (konkurrerende love) er det dog muligt at maksimere kriteriets magt [13] ved at vælge antallet af intervaller og metoden til at opdele definitionsdomænet for en tilfældig variabel i intervaller .

Se også

Noter

  1. Chernoff H., Lehmann EL Brugen af ​​estimater for maksimal sandsynlighed i test for godhed  //  The Annals of Mathematical Statistics. - 1954. - Bd. 25 . - s. 579-586 .
  2. Lemeshko B. Yu., Postovalov S. N. Om afhængigheden af ​​de begrænsende fordelinger af Pearson-statistikker og sandsynlighedsforholdet på metoden til gruppering af data  // Industrial Laboratory. - 1998. - T. 64 , no. 5 . - S. 56-63 .
  3. Nikulin M.S. Chi-square test for kontinuerte fordelinger med skift- og skalaparametre  // Sandsynlighedsteori og dens anvendelse. - 1973. - T. XVIII , no. 3 . - S. 583-591 .
  4. Nikulin M.S. Om chi-kvadratkriteriet for kontinuerte fordelinger  // Sandsynlighedsteori og dens anvendelse. - 1973. - T. XVIII , no. 3 . - S. 675-676 .
  5. Rao KC, Robson DS En chi-kvadrat-statistik for goodness-of-fit-tests inden for den eksponentielle familie  //  Commun. statistik. - 1974. - Bd. 3 . - S. 1139-1153 .
  6. Greenwood PE, Nikulin MS En guide til chi-kvadrattestning  . — New York: John Wiley & Sons, 1996. — 280 s.
  7. Lemeshko B. Yu. Asymptotisk optimal gruppering af observationer i godhed-of-fit-kriterier  // Fabrikslaboratorium. - 1998. - T. 64 , no. 1 . - S. 56-64 .
  8. 1 2 3 R 50.1.033-2001. Anbefalinger til standardisering. Anvendt statistik. Regler for kontrol af overensstemmelsen mellem den eksperimentelle fordeling og den teoretiske. Del I. Chi-Square Tests . - M . : Forlag for standarder, 2006. - 87 s.
  9. 1 2 Lemeshko B. Yu., Chimitova E. V. Om valget af antallet af intervaller i typeaftalekriterierne // Fabrikslaboratorium  . materialediagnostik. - 2003. - T. 69 , no. 1 . - S. 61-67 .
  10. Denisov V. I., Lemeshko B. Yu. Optimal gruppering i behandlingen af ​​eksperimentelle data // Måling af informationssystemer. - Novosibirsk, 1979. - S. 5-14.
  11. Lemeshko B. Yu., Lemeshko S. B., Postovalov S. N. Komparativ analyse af styrken af ​​godhed-of-fit-tests under tætte konkurrerende hypoteser. I. Test af simple hypoteser  // Siberian Journal of Industrial Mathematics. - 2008. - T. 11 , no. 2(34) . - S. 96-111 .
  12. Lemeshko B. Yu., Lemeshko S. B., Postovalov S. N. Komparativ analyse af styrken af ​​godhed-of-fit-tests med tætte alternativer. II. Test af komplekse hypoteser  // Siberian Journal of Industrial Mathematics. - 2008. - T. 11 , no. 4(36) . - S. 78-93 .
  13. Lemeshko B. Yu., Lemeshko S. B., Postovalov S. N., Chimitova E. V. Statistisk dataanalyse, modellering og undersøgelse af probabilistiske mønstre. Computer tilgang . - Novosibirsk: Publishing House of NSTU, 2011. - 888 s. — (Monografier af NSTU). — ISBN 978-5-7782-1590-0 . — Afsnit 4.9.

Litteratur

Se også

Links