Kvantil

En kvantil i matematisk statistik  er en værdi, som en given stokastisk variabel ikke overskrider med en fast sandsynlighed . Hvis sandsynligheden er angivet i procent, så kaldes kvantilen en percentil eller percentil (se nedenfor ).

For eksempel betyder sætningen "90. percentil af kropsvægt hos nyfødte drenge er 4 kg" [1] at 90 % af drenge er født med en vægt på mindre end eller lig med 4 kg, og 10 % af drenge er født med en vægt på mere end 4 kg .

Definition

Overvej et sandsynlighedsrum og  er et sandsynlighedsmål, der specificerer fordelingen af ​​en tilfældig variabel . Lad det blive ordnet . Så er -kvantilen (eller niveaukvantilen ) af fordelingen tallet , sådan at

,

I nogle kilder (for eksempel i engelsksproget litteratur) er -m -kvantilen niveaukvantilen , det vil sige -kvantilen i den foregående notation.

Noter

hvor  er fordelingsfunktionen .

  1. vi sammensætter en variationsrække af værdier (prøven har et volumen ), og overvejer også det (dette er nødvendigt, når man beregner 100% kvantilen ved hjælp af formlerne nedenfor);
  2. find værdien ;
  3. sammenligne og :
a) hvis , så sætter vi ; b) hvis , så sætter vi ; c) hvis , så antager vi .

Givet på denne måde opfylder -kvantilen ovenstående definition.

I nogle tilfælde (med en stor stikprøvestørrelse og en empirisk fordeling tæt på kontinuerlig) kan en tilnærmet sammenligning bruges i stedet for lighed (dette vil f.eks. gøre det muligt at repræsentere 1/3-niveaukvantilen som 0,33 ... 333 i computerdatabehandling).

Median og kvartiler

Interquartile range ( eng.  Interquartile range ) er forskellen mellem den tredje og første kvartil , dvs. Interkvartilområdet er en karakteristik af spredningen af ​​fordelingen af ​​en værdi og er en robust analog af spredningen . Sammen kan median- og interkvartilområdet bruges i stedet for middelværdien og variansen ved fordelinger med store outliers, eller når sidstnævnte ikke kan beregnes.

Decil

En decil karakteriserer fordelingen af ​​befolkningsværdier, hvor ni decilværdier deler den i ti lige store dele. Enhver af disse ti dele er 1/10 af det samlede antal. Således adskiller den første decil de 10% af de mindste værdier under decilen fra de 90% af de største værdier over decilen.

Ligesom i tilfældet med mode og median, i intervalvariationsrækken af ​​distribution, hører hver decil (og kvartil) til et bestemt interval og har en veldefineret værdi [2] .

Percentil

Den th percentil er niveaukvantilen . Følgelig er medianen 50. percentilen, og den første og tredje kvartil  er henholdsvis 25. og 75. percentilen.

Generelt er begreberne kvantil og percentil udskiftelige. , samt skalaerne til beregning af sandsynligheder - absolut og procent.

Percentiler kaldes også for percentiler eller centiler .

Kvantiler af standard normalfordelingen

Sandsynlighed (kvantilniveau), % 99,99 99,90 99,00 97,72 97,50 95,00 90,00 84,13 50,00
Kvantil (afrundet til tusindedele) 3.719 3,090 2.326 1.999 1.960 1.645 1,282 1.000 0.000

Se også

Noter

  1. Vejledning til den lokale børnelæge . - GEOTAR-Media, 2008. - S. 44. - 354 s.
  2. Shmoylova R. A., Minashkin V. G., Sadovnikova N. A. Workshop om teorien om statistik. - 3. udg. - M. : Finans og statistik, 2011. - S. 130-131. — 416 s. — ISBN 9785279032969 . .

Links