Et histogram i matematisk statistik er en af de grafiske metoder til at studere fordelingsrækken af værdier af en tilfældig variabel. [B:1]
Blandt de grafiske metoder til at studere distributionsserier er følgende angivet [1] :
Trinpolygoner og frekvenspolygoner kaldes tilsammen fordelingspolygoner . Spredningsplottet, trinpolygonen og frekvenspolygonen er angivet som de mest bekvemme. [en]
For det todimensionelle tilfælde er der i stedet for en distributionsserie konstrueret en fordelingstabel, og den tilsvarende grafiske konstruktion kaldes et prismogram . [en]
GOST R 50779.10-2000 tilbød følgende definitioner:
2.17 histogram
En grafisk repræsentation af frekvensfordelingen for en kvantitativ karakteristik, dannet af sammenhængende rektangler, hvis baser er klasseintervaller, og hvis arealer er proportionale med frekvenserne af disse klasser
2.18 søjlediagram
En grafisk repræsentation af frekvensfordelingen for en diskret stokastisk variabel, dannet af et sæt søjler af samme bredde, hvis højder er proportionale med frekvenserne[D:1]
Lad være et eksempel fra en distribution . Lad os definere en partition af den rigtige linje . Lade
er antallet af prøveelementer, der falder ind i det th interval. Derefter en stykkevis konstant funktion , som har formen:
kaldes et normaliseret histogram.[2]Lad fordelingen af stokastiske variable være absolut kontinuert og være givet ved sandsynlighedstætheden . Derefter
med sandsynlighed kl . [3]Når man tegner efter metoden med rektangler, er den vandrette akse opdelt i lige store segmenter svarende til rækkerne ; på disse segmenter, som på baserne, bygges rektangler med en højde, der er proportional med frekvensen af en given udledning. [fire]
Lad os beskrive denne procedure mere detaljeret. For det første er det sæt af værdier, som prøveelementet kan tage, opdelt i flere bits (bins). Oftest tages disse intervaller ens, men det er ikke et strengt krav. Disse intervaller er plottet på den vandrette akse, hvorefter der tegnes et rektangel over hver. Hvis alle intervaller var ens, så er højden af hvert rektangel proportional med antallet af prøveelementer, der falder ind i det tilsvarende interval. Hvis intervallerne er forskellige, så vælges højden af rektanglet således, at dets areal er proportionalt med antallet af prøveelementer, der falder ind i dette interval.
Det er vigtigt for at konstruere et histogram at vælge den optimale partition, da når intervallerne øges, falder detaljerne i fordelingstæthedsestimatet, og når intervallerne falder, falder nøjagtigheden af dens værdi. For at vælge det optimale antal intervaller bruges Sturges-reglen ofte .
,hvor er det samlede antal observationer af mængden, er grundtallet 2-logaritmen og er den heltallige del af .
Ofte findes også en regel, der estimerer det optimale antal intervaller som kvadratroden af det samlede antal målinger:
Repræsentation af fordelingsrækkerne i transformeret form er en nødvendig betingelse, når man sammenligner disse serier med hinanden [1] .
Studiet af distributionsserier lettes i høj grad ved brugen af den grafiske metode . Ved afbildning af distributionsserier er værdierne af udladningerne eller de observerede værdier af den stokastiske variabel plottet på henholdsvis den vandrette akse og på den lodrette akse bitfrekvenserne eller de observerede frekvenser [1] .
Konstruktionen af histogrammer bruges til at opnå et empirisk estimat af fordelingstætheden af en stokastisk variabel [5] .
I den mest overordnede form er en af de vigtigste opgaver formuleret således: test på et givet signifikansniveau hypotesen om, at fordelingen præsenteret på histogrammet er monomodal [A: 1] .
Histogramanalyse anses traditionelt blandt geologer for at være en klar og informativ metode til løsning af geologiske problemer, da histogramanalyse gør det muligt at teste geologiske hypoteser formuleret på statistiksproget [A: 1] .
I kardiologi er konstruktionen og beskrivelsen af et histogram en obligatorisk geometrisk metode til analyse af hjertefrekvensvariabilitet , foreslået af 1996 [A: 2] [B: 2] standarderne . Som yderligere måder at beskrive hjertefrekvenshistogrammer på, anvendes metoder til deres trekantede fortolkning , såsom St. George-indekset og det trekantede indeks [6] .
I produktionen, når man analyserer tilstanden af den teknologiske proces, betragtes konstruktionen af histogrammer som en effektiv måde at vurdere situationen og udføre en analyse på i første fase af undersøgelse af stabiliteten af den teknologiske proces, og den betragtes også som en af de effektive kvalitetsstyringsværktøjer på stadiet af kvalitetskontrol af det færdige produkt og analyse af den aktuelle tilstand af den teknologiske proces [A :3] .