Median (fra latin mediāna "midt") eller den midterste værdi af et sæt tal - det tal, der er i midten af dette sæt, hvis sorteret i stigende rækkefølge, det vil sige et sådant tal, at halvdelen af elementerne i mængden er ikke mindre end det, og den anden halvdel er ikke mere . En anden ækvivalent definition [1] : medianen af et sæt tal er et tal, summen af afstande (eller mere strengt moduler ) hvorfra alle tal fra mængden er minimal. Denne definition generaliserer naturligvis til multivariate datasæt og kaldes 1-medianen .
For eksempel er medianen af sættet {11, 9, 3, 5, 5} tallet 5, da det er i midten af dette sæt efter dets rækkefølge: {3, 5, 5, 9, 11}. Hvis prøven har et lige antal elementer, er medianen muligvis ikke entydigt bestemt: for numeriske data bruges halvsummen af to tilstødende værdier oftest (det vil sige medianen af sættet {1, 3) , 5, 7} er lig med 4), se nedenfor for detaljer . I matematisk statistik kan medianen bruges som en af kendetegnene for en prøve eller et sæt tal.
Medianen af den stokastiske variabel er også defineret : i dette tilfælde er den defineret som det tal, der halverer fordelingen. Groft sagt er medianen af en stokastisk variabel et tal, således at sandsynligheden for at få værdien af den stokastiske variabel til højre for den er lig med sandsynligheden for at få værdien af den stokastiske variabel til venstre for den (og de er begge lig med 1/2), er en mere præcis definition givet nedenfor .
Medianen kan også siges at være den 50. percentil , 0,5 kvantil eller anden kvartil af en prøve eller fordeling.
Hvis fordelingen er kontinuert, så er medianen en af løsningerne til ligningen
,hvor er fordelingsfunktionen af den stokastiske variabel forbundet med fordelingstætheden som
.Hvis fordelingen er en kontinuerlig , strengt stigende funktion, så er løsningen af ligningen unik. Hvis fordelingen har diskontinuiteter, så kan medianen falde sammen med den minimale eller maksimale (ekstrem) mulige værdi af den stokastiske variabel, hvilket modsiger den "geometriske" forståelse af dette udtryk.
Medianen er et vigtigt kendetegn ved fordelingen af en stokastisk variabel og kan ligesom den matematiske forventning bruges til at centrere fordelingen. Da estimater af medianen er mere robuste , kan dens estimering være mere at foretrække for distributioner med såkaldte. tunge haler . Fordelene ved at estimere medianen i forhold til den matematiske forventning kan dog kun diskuteres, hvis disse fordelingsegenskaber er sammenfaldende, især for symmetriske sandsynlighedstæthedsfunktioner.
Medianen bestemmes for alle fordelinger, og i tilfælde af tvetydighed forlænges den naturligvis, mens den matematiske forventning måske ikke er defineret (f.eks. for Cauchy-fordelingen ).
Overvej den økonomiske situation for 19 fattige mennesker, som hver kun har 5 ₽ , og en millionær, som bogstaveligt talt har 1 million ₽. Så får de i alt 1.000.095 ₽ . Hvis pengene deles i lige store dele af 20 personer, får du 50.004,75 ₽ . Dette vil være det aritmetiske gennemsnit af det beløb, som alle 20 personer i rummet havde.
Medianen vil være lig med 5 ₽ (summen af "afstanden" fra denne værdi til tilstanden for hver af de personer, der overvejes, er minimal). Dette kan fortolkes på følgende måde: Ved at "dele" alle de personer, der overvejes i to lige store grupper på 10 personer, får vi, at i den første gruppe har alle ikke mere end 5 ₽, mens i den anden - ikke mindre end 5 ₽.
Ud fra dette eksempel viser det sig, at det groft sagt er mest korrekt at bruge medianen som "midterste" tilstand, men det aritmetiske gennemsnit overstiger tværtimod betydeligt mængden af kontanter, der er til rådighed for en tilfældig person fra stikprøven .
Ændringer i dynamikken er også forskellige for det aritmetiske gennemsnit med en median, for eksempel i ovenstående eksempel, hvis en millionær vil have 1,5 millioner rubler (+50%), og resten vil have 6 rubler (+20%), så det aritmetiske gennemsnit af stikprøven vil være lig med 75.005,70 ₽ , det vil sige, det ser ud til, at alle ville være steget jævnt med 50 %, mens medianen bliver lig med 6 ₽ (+20 %).
Hvis der er et lige antal tilfælde, og to midler er forskellige, kan et hvilket som helst tal mellem dem pr. definition tjene som medianen (for eksempel i prøven {1, 3, 5, 7}, et hvilket som helst tal fra intervallet (3.5) kan tjene som medianen). I praksis, i dette tilfælde, bruges det aritmetiske middelværdi af to gennemsnitsværdier oftest (i eksemplet ovenfor er dette tal (3+5)/2=4). For prøver med et lige antal elementer kan du også introducere begrebet "nedre median" (element med nummer n/2 i en ordnet række af elementer; i eksemplet ovenfor er dette tal 3) og "øvre median" (element med tal (n + 2) / 2 ; i eksemplet ovenfor er det tallet 5) [2] . Disse begreber defineres ikke kun for numeriske data, men også for enhver ordinær skala .
![]() |
---|
Betyde | |
---|---|
Matematik | Effektmiddel ( vægtet ) harmonisk middel vægtet geometrisk middelværdi vægtet Gennemsnit vægtet geometriske middelværdi Gennemsnitlig kubik glidende gennemsnit Aritmetisk-geometrisk middelværdi Funktion Middel Kolmogorov mener |
Geometri | |
Sandsynlighedsteori og matematisk statistik | |
Informationsteknologi | |
Sætninger | |
Andet |