Hvordan man lyver med statistik

Hvordan man lyver med statistik
Forfatter Darell Huff
Originalsprog engelsk
Original udgivet 1954
Indretning Irving Geis
Forlægger W. W. Norton & Company Inc.
sider 142
ISBN 0-393-31072-8

How to Lie with Statistics  er en bog skrevet af Darell Huff .i 1954. Hun fortæller om de forskellige måder, hvorpå statistik kan misbruges til at bedrage publikum og manipulere deres meninger. Mange specifikke eksempler overvejes, hovedsageligt fra det amerikanske liv (reklamer, politik, propaganda og agitation).

Den første epigraf til bogen er et citat fra grev Beaconsfield (B. Disraeli) om statistik: "Der er tre typer løgne: løgne, åbenlyse løgne og statistikker."

Bogen henvender sig til den ikke-specialistlæser og er forsynet med levende illustrationer. Materialet præsenteres levende og i en tilgængelig form, hvilket sikrede bogens høje popularitet - det er en af ​​de mest udbredte publikationer om statistik i anden halvdel af det 20. århundrede [1] .

Indhold

Eksemplet er i sagens natur partisk

En forklaring på, hvad sampling er , hvordan interviewere ubevidst udvælger interviewpersoner og påvirker deres svar.

Et velvalgt gennemsnit

Typerne af gennemsnit overvejes:

Eksemplerne viser, hvordan valget af typen af ​​middelværdi påvirker dens værdi for de samme prøver. Opmærksomheden henledes på muligheden for at manipulere en uforberedt læser ved at vælge en "praktisk" (for manipulatoren) type gennemsnit.

Nuancer, der er beskedent tavse

I dette kapitel overvejer forfatteren vigtige nuancer af statistisk forskning, som ofte bevidst eller ubevidst er udeladt i artikler beregnet til den brede offentlighed.

Betydningen af ​​stikprøvestørrelsen og dens sammenhæng med populationstypen forklares. Eksempler på prøvestørrelsesmanipulationer er givet:

Begreber introduceres:

På eksemplet med Hessel udviklingsskalaentaler om faren ved at opfatte en punktvurdering (uden for intervallet) af gennemsnitsværdien - forældre begynder at gå i panik, hvis deres barn ikke opfylder normen (gennemsnitsværdi).

Opmærksomheden henledes på vigtigheden af ​​formuleringer i artikler baseret på statistik. Som et eksempel kan du overveje erklæringen fra elforsyningsselskaberne (1948): "Elektrisk strøm er tilgængelig for mere end 3/4 af farmene i USA." Ordet "tilgængelig", som ikke er defineret på nogen måde i applikationen, gør det meningsløst - det betyder normalt, at elledningen er placeret i en afstand af 10-100 miles (16-160 km) fra gården, men noget andet kan forstås som tilgængelighed. Forfatteren bemærker også, at når man fortolker de samme data, kunne man lægge den modsatte vægt ved at skrive: "Elektrisk strøm er ikke tilgængelig for en fjerdedel af amerikanske farme."

Kapitlet slutter med en påmindelse om vigtigheden af ​​at have tal på diagrammer – et diagram over en virksomheds indtjeningsvækst over flere år (offentliggjort i magasinet Fortune) fortæller ikke læseren noget, fordi y-aksen er blottet for numeriske etiketter. Ud fra en sådan graf er det umuligt at sige, om væksten i overskuddet var signifikant, gennemsnitlig eller tæt på nul.

Much Ado About Nothing

Begreberne konfidensinterval og konfidensniveau er illustreret med eksempler fra det virkelige liv:

Tidsplanen er så god som den bliver

Det første af kapitlerne er viet til overvejelser om måder at manipulere ved hjælp af grafisk information.

Overvejer måder at forvrænge opfattelsen af ​​grafer på:

Skematisk billede

Forstå måder at bedrage publikum på ved hjælp af infografik .

Brugen af ​​grafiske objekter forbundet med den information, der præsenteres, åbner store muligheder for misbrug. Dette udsagn er illustreret med en række eksempler:

Figuren nedenfor viser et eksempel på infografisk misbrug - det andet objekt er visuelt 8 gange større:

Pseudo-justificeret figur

Kapitlet åbner med en skarp anbefaling: "Hvis du ikke kan bevise, hvad du vil, så demonstrer noget andet og lad som om, at disse ting er de samme."

Der er mange eksempler på sådanne svindelnumre. I særdeleshed:

Igen, "efter skyldes"

Dette kapitel taler om begrebet korrelation og den forvirring, der ofte opstår mellem årsag og virkning. Hvis fænomen A og B optræder sammen, kan dette forklares på tre måder:

  1. Fænomen A er en konsekvens af fænomen B
  2. Fænomen B er en konsekvens af fænomen A
  3. Fænomen A og B er konsekvenser af et andet/andre fænomen(er)

Der gives en række eksempler på fejlagtige vurderinger om årsagssammenhænge. I særdeleshed:

Kapitlet slutter med et næsten anekdotisk (men reelt) eksempel på forvirringen af ​​årsag og virkning blandt de indfødte på De Nye Hebrider. De troede, at tilstedeværelsen af ​​lus fører til sundhed. Denne konklusion blev draget på baggrund af, at lusene forlod den syge (fordi, på grund af den øgede kropstemperatur, blev levevilkårene for dem ubehagelige), mens alle raske mennesker havde dem (der var med andre ord en positiv sammenhæng mellem sundhed og tilstedeværelsen af ​​lus).

Sådan produceres statistik

Statistiske manipulationer er statistiske manipulationer. I dette kapitel viser forfatteren endnu en gang, hvordan man manipulerer statistiske data ved hjælp af specifikke eksempler. Han opfordrer dog indtrængende til ikke vilkårligt at afvise statistiske data, men til at studere dem eftertænksomt, grundigt, med forsigtig vantro, før han tager det til efterretning.

Sådan sætter du statistik på plads

Forfatteren foreslår at kontrollere de statistiske data ved hjælp af fem enkle spørgsmål:

Udgaver på andre sprog

På russisk

Noter

  1. "I løbet af de sidste halvtreds år har How to Lie with Statistics solgt flere eksemplarer end nogen anden statistisk tekst." JM Steele. " Darrell Huff og Fifty Years of How to Lie with Statistics Arkiveret 23. februar 2021 på Wayback Machine . Statistical Science , 20(3), 2005, 205-209.

Links