Frekvensfordeling

Frekvensfordeling  er en metode til statistisk beskrivelse af data (målte værdier, karakteristiske værdier). Matematisk er frekvensfordelingen en funktion, der først og fremmest bestemmer den ideelle værdi for hver indikator, da denne værdi normalt allerede er målt. En sådan fordeling kan præsenteres i form af en tabel eller graf ved at modellere funktionelle ligninger. I deskriptiv statistik har frekvensfordelingen en række matematiske funktioner, der bruges til at udflade og analysere frekvensfordelingen (såsom den gaussiske normalfordeling ).

Metode

Mængden af ​​data (målte værdier, undersøgelsesdata) er den første originale uordnede liste. Først skal det sorteres. Fra den oprindelige liste kan der i dette tilfælde være en lille afvigelse af kvantiler (statistisk spredning), sandsynlig afvigelse og standardafvigelse ( tommelfingerregel : standardafvigelse = afstand / 6).

Derefter tildeler vi en værdi til hver værdi og summerer dem op. Som regel får vi den absolutte frekvens. Baseret på de absolutte frekvensdata beregner vi det samlede antal prøveværdier og beregner de relative frekvenser. Nu har vi et ordnet sæt af værdipar (karakteristiske værdier og deres tilhørende relative frekvenser), den såkaldte rating.

Lad os tilføje de relative frekvenser, begyndende med den mindste funktionsværdi, og tildele hver funktion værdien af ​​summen (inklusive dets eget bidrag), så vi får fordelingen . Dette angiver for hver karakteristisk værdi, hvor stor dens andel er mindre end eller lig med den tilsvarende karakteristiske værdi. Procentdelen starter ved 0 og går op til 1 eller 100. Grafisk er dette repræsenteret af en svag monotont stigende kurve , som har en aflang S-form. Der er talrige forsøg på at reproducere fordelingsresultater ved hjælp af funktionelle ligninger . Sumfordelingen, afhængigt af funktionernes værdier, er den enkleste form for repræsentation af frekvensfordelingen.

Ifølge reglerne er det også nødvendigt at klassificere karakteristiske værdier. Denne procedure opdeler rækken af ​​værdier, der forekommer, for eksempel i 10 eller 20 lige brede klasser (sparsomme værdier ved kanterne (se " outliers ") nogle gange grupperet sammen i større klasser). Derefter bestemmes tætheden af ​​funktionen , den afledte af fordelingsfunktionen, i overensstemmelse med karakteristikken for værdien i tilfælde af en kontinuerlig fordeling. Derudover kan frekvensen bestemmes ikke kun ved at tælle, men også for eksempel ved vejning. Så får vi en massefordeling i stedet for en distributionsserie. I princippet kan enhver additiv mængde bruges til at måle frekvensen. Hvis en tilfældig stikprøve er meget forskellig fra en normalfordeling (klokkekurve), kan dataene være skæv ved at vælge effekter eller tendenser. Forskellige statistiske test giver slutninger eller variansanalyser . Hvis stikprøvestørrelsen er i superposition af flere delmængder (aldersfordeling, erhverv, grupper), så kan fordelingen af ​​frekvenser i stedet for de maksimale også være to- eller multivariat.

Se også

Litteratur