Hvordan man lyver med statistik
Hvordan man lyver med statistik |
Forfatter |
Darell Huff |
Originalsprog |
engelsk |
Original udgivet |
1954 |
Indretning |
Irving Geis |
Forlægger |
W. W. Norton & Company Inc. |
sider |
142 |
ISBN |
0-393-31072-8 |
How to Lie with Statistics er en bog skrevet af Darell Huff .i 1954. Hun fortæller om de forskellige måder, hvorpå statistik kan misbruges til at bedrage publikum og manipulere deres meninger. Mange specifikke eksempler overvejes, hovedsageligt fra det amerikanske liv (reklamer, politik, propaganda og agitation).
Den første epigraf til bogen er et citat fra grev Beaconsfield (B. Disraeli) om statistik: "Der er tre typer løgne: løgne, åbenlyse løgne og statistikker."
Bogen henvender sig til den ikke-specialistlæser og er forsynet med levende illustrationer. Materialet præsenteres levende og i en tilgængelig form, hvilket sikrede bogens høje popularitet - det er en af de mest udbredte publikationer om statistik i anden halvdel af det 20. århundrede [1] .
Indhold
Eksemplet er i sagens natur partisk
En forklaring på, hvad sampling er , hvordan interviewere ubevidst udvælger interviewpersoner og påvirker deres svar.
Et velvalgt gennemsnit
Typerne af gennemsnit overvejes:
Eksemplerne viser, hvordan valget af typen af middelværdi påvirker dens værdi for de samme prøver. Opmærksomheden henledes på muligheden for at manipulere en uforberedt læser ved at vælge en "praktisk" (for manipulatoren) type gennemsnit.
Nuancer, der er beskedent tavse
I dette kapitel overvejer forfatteren vigtige nuancer af statistisk forskning, som ofte bevidst eller ubevidst er udeladt i artikler beregnet til den brede offentlighed.
Betydningen af stikprøvestørrelsen og dens sammenhæng med populationstypen forklares. Eksempler på prøvestørrelsesmanipulationer er givet:
- Test af effektiviteten af tandpasta. Laboratorieundersøgelser af virkningen af at bruge tandpasta på seks forsøgspersoner udføres. Nogle gange udføres en række sådanne undersøgelser, og undersøgelsen, der viste et gavnligt resultat for kunden (pastaproducenten), bruges i reklamekampagner.
- Polio vaccine test. 450 børn blev vaccineret, 680 blev ikke vaccineret (kontrolgruppe). Kort efter brød en epidemi ud i området, og de vaccinerede børn havde ikke et eneste tilfælde af polioinfektion. Det gjorde ingen af kontrolgruppens medlemmer heller. Forsøget blev gjort ubrugeligt lige fra begyndelsen på grund af forkert valg af antal deltagere, da der ikke kan forventes mere end to tilfælde af infektion i en gruppe af denne størrelse.
Begreber introduceres:
På eksemplet med Hessel udviklingsskalaentaler om faren ved at opfatte en punktvurdering (uden for intervallet) af gennemsnitsværdien - forældre begynder at gå i panik, hvis deres barn ikke opfylder normen (gennemsnitsværdi).
Opmærksomheden henledes på vigtigheden af formuleringer i artikler baseret på statistik. Som et eksempel kan du overveje erklæringen fra elforsyningsselskaberne (1948): "Elektrisk strøm er tilgængelig for mere end 3/4 af farmene i USA." Ordet "tilgængelig", som ikke er defineret på nogen måde i applikationen, gør det meningsløst - det betyder normalt, at elledningen er placeret i en afstand af 10-100 miles (16-160 km) fra gården, men noget andet kan forstås som tilgængelighed. Forfatteren bemærker også, at når man fortolker de samme data, kunne man lægge den modsatte vægt ved at skrive: "Elektrisk strøm er ikke tilgængelig for en fjerdedel af amerikanske farme."
Kapitlet slutter med en påmindelse om vigtigheden af at have tal på diagrammer – et diagram over en virksomheds indtjeningsvækst over flere år (offentliggjort i magasinet Fortune) fortæller ikke læseren noget, fordi y-aksen er blottet for numeriske etiketter. Ud fra en sådan graf er det umuligt at sige, om væksten i overskuddet var signifikant, gennemsnitlig eller tæt på nul.
Much Ado About Nothing
Begreberne konfidensinterval og konfidensniveau er illustreret med eksempler fra det virkelige liv:
- Forskellen i IQ-testscore mellem 98 og 101 gør det umuligt at sige, hvilket forsøgsperson der har en højere IQ, som det kan ses af den fulde registrering af testresultaterne: henholdsvis 98 ± 3 og 101 ± 3.
- Måling af indholdet af skadelige stoffer i forskellige cigarettermærker afslørede fraværet af nogen signifikant forskel mellem dem. Ikke desto mindre lå et af mærkerne på sidstepladsen hvad angår indholdet af skadelige stoffer (omend med en ubetydelig margin fra første omgang!). Producenten af disse cigaretter (Old Gold) lancerede en reklamekampagne, hvor de hævdede, at Old Gold-cigaretter indeholdt de mindst skadelige stoffer, ifølge et uafhængigt laboratorium.
Tidsplanen er så god som den bliver
Det første af kapitlerne er viet til overvejelser om måder at manipulere ved hjælp af grafisk information.
Overvejer måder at forvrænge opfattelsen af grafer på:
- "Komprimering" af en del af koordinatgitteret, tilsyneladende for at spare plads. I virkeligheden fører det til vanskeligheder i opfattelsen af skala
- Skalaændring langs abscisse og ordinatakser. Denne metode giver dig mulighed for at "vende" (visuelt) vækst, tæt på nul, i en udtalt bæredygtig. Som eksempel er angivet det statstilskudsvækstdiagram, der er givet i en af udmeldingerne. Stigningen var kun 4 %, men lignede visuelt næsten 400 % på grund af stigningen i skalaen langs y-aksen.
Skematisk billede
Forstå måder at bedrage publikum på ved hjælp af infografik .
Brugen af grafiske objekter forbundet med den information, der præsenteres, åbner store muligheder for misbrug. Dette udsagn er illustreret med en række eksempler:
- For at sammenligne to lønninger kan du bruge infografik og trække to poser med penge. Hvis den anden løn er dobbelt så høj som den første, så vil den anden pose ikke kun være højere, men også dobbelt så bred (hvilket er nødvendigt for at opretholde proportionen). Og da posen er et tredimensionelt objekt, vil konturen af den anden taske være dobbelt så tyk som den første. Som et resultat heraf opfatter vores syn den anden pose som en pose 8 (ikke 2!) gange større end den første. Denne teknik blev brugt af magasinet Newsweek.
- En annonce for American Institute of Steel and Alloys brugte en infografik til at vise en stigning i stålproduktionen mellem 1930 og 1940 med 4,25 millioner tons (fra 10 millioner til 14,25 millioner). Den infografiske teknik (bevidst forvrængning af proportioner blev tilføjet til de tidligere diskuterede metoder) førte til, at den angivne stigning i smeltning visuelt blev opfattet som 1500%. Forfatteren bemærker, at dette er tilfældet, når "aritmetik bliver til fantasi."
- Brug af billeder af køer af forskellig størrelse til at vise forskellige mælkeydelser gennem årene. Ud over de allerede omtalte effekter fører denne metode til endnu en misforståelse - læseren tror måske, at ikke kun mælkeydelsen er blevet højere, men køerne er også større.
Figuren nedenfor viser et eksempel på infografisk misbrug - det andet objekt er visuelt 8 gange større:
Pseudo-justificeret figur
Kapitlet åbner med en skarp anbefaling: "Hvis du ikke kan bevise, hvad du vil, så demonstrer noget andet og lad som om, at disse ting er de samme."
Der er mange eksempler på sådanne svindelnumre. I særdeleshed:
- Udsendelsen af en undersøgelse af folks meninger om lige muligheder for hvide og afroamerikanere for at få et job til den reelle situation på arbejdsmarkedet. Denne undersøgelse kan vise bedre resultater, jo flere mennesker med racefordomme mod afroamerikanere deltager i den, da sådanne respondenter har en tendens til at tro, at der ikke er nogen racediskrimination på arbejdsmarkedet.
- Cigaretannoncer brugte følgende argument: "Mere end 27 % af et stort udvalg af velkendte læger ryger Throaties, den højeste andel af ethvert cigaretmærke." Annoncen antydede implicit, at lægerne vidste noget særligt, ukendt for resten, om skaden forårsaget af forskellige cigarettermærker. Men det er det ikke.
- En annonce for en juicer hævdede, at laboratorietest viste, at den presser 26 % mere juice. Da spørgsmålet blev stillet - "end hvad?", blev svaret modtaget - "end en manuel keglesaftpresser." Selvom den oprindelige udtalelse er sand, tillader den dig ikke at sammenligne det annoncerede produkt med konkurrenternes produkter. Det kan være det værste på markedet, men overgår stadig en manuel juicer med 26% i ekstraktionseffektivitet.
- Dødeligheden i flåden under den spansk-amerikanske krig var 0,09%. For civile i New York i samme periode var det 0,16%. Søværnet brugte disse tal til at føre kampagne for militærtjeneste. Men det er forkert at sammenligne disse indikatorer - unge og raske mennesker rekrutteres til flåden, og babyer, gamle mennesker, syge mennesker rekrutteres til civilbefolkningen.
Igen, "efter skyldes"
Dette kapitel taler om begrebet korrelation og den forvirring, der ofte opstår mellem årsag og virkning. Hvis fænomen A og B optræder sammen, kan dette forklares på tre måder:
- Fænomen A er en konsekvens af fænomen B
- Fænomen B er en konsekvens af fænomen A
- Fænomen A og B er konsekvenser af et andet/andre fænomen(er)
Der gives en række eksempler på fejlagtige vurderinger om årsagssammenhænge. I særdeleshed:
- Undersøgelser har vist, at der er flere dårligt præsterende blandt elever, der ryger, end blandt ikke-rygere. Dette faktum blev brugt i anti-tobakskampagnen. Men man kan ikke ud fra dette resultat slutte, at rygning har en negativ effekt på elevernes evner. Det er muligt, at elever er begyndt at ryge på grund af dårlige akademiske præstationer, eller de studerer dårligt og ryger på grund af en tredje årsag (f.eks. vanskelige levevilkår).
- Forskning viser en positiv sammenhæng mellem uddannelsesniveau og indkomst. Det kan ikke sluttes af dette faktum, at hvis du (din søn, datter osv.) får en videregående uddannelse, så vil de helt sikkert og nødvendigvis have en højere indkomst, end hvis de ikke fik den. Desuden giver denne sammenhæng os ikke som hovedregel mulighed for at konkludere, at det er videregående uddannelse, der fører til højere indkomst – måske kommer de, der har modtaget den, fra velhavende familier, og derfor får de en højere indkomst i voksenalderen. Her er et eksempel på en post hoc fejlSe også Logiske fejl .
- En undersøgelse af 1.500 typiske midaldrende universitetskandidater viste, at 93 % af mændene var gift (mod 83 % for den almindelige befolkning), mens kun 65 % af kvinderne var gift. Heraf konkluderes det, at en uddannet kvinde er mindre tilbøjelig til at blive gift end en uuddannet. Men undersøgelsen viser ikke en årsagssammenhæng mellem disse fænomener. Måske ville disse ugifte kvinder være forblevet ugifte, selvom de ikke havde taget eksamen fra universitetet.
Kapitlet slutter med et næsten anekdotisk (men reelt) eksempel på forvirringen af årsag og virkning blandt de indfødte på De Nye Hebrider. De troede, at tilstedeværelsen af lus fører til sundhed. Denne konklusion blev draget på baggrund af, at lusene forlod den syge (fordi, på grund af den øgede kropstemperatur, blev levevilkårene for dem ubehagelige), mens alle raske mennesker havde dem (der var med andre ord en positiv sammenhæng mellem sundhed og tilstedeværelsen af lus).
Sådan produceres statistik
Statistiske manipulationer er statistiske manipulationer. I dette kapitel viser forfatteren endnu en gang, hvordan man manipulerer statistiske data ved hjælp af specifikke eksempler. Han opfordrer dog indtrængende til ikke vilkårligt at afvise statistiske data, men til at studere dem eftertænksomt, grundigt, med forsigtig vantro, før han tager det til efterretning.
Sådan sætter du statistik på plads
Forfatteren foreslår at kontrollere de statistiske data ved hjælp af fem enkle spørgsmål:
- Hvem taler?
- Hvordan ved han det?
- Hvad mangler der?
- Er studieobjektet ændret?
- Giver det mening?
Udgaver på andre sprog
På russisk
- Darell Huff. Sådan lyver du med statistik = Sådan lyver du med statistik. — M .: Alpina Publisher , 2015. — 163 s. — ISBN 978-5-9614-5212-9 .
Noter
- ↑ "I løbet af de sidste halvtreds år har How to Lie with Statistics solgt flere eksemplarer end nogen anden statistisk tekst." JM Steele. " Darrell Huff og Fifty Years of How to Lie with Statistics Arkiveret 23. februar 2021 på Wayback Machine . Statistical Science , 20(3), 2005, 205-209.
Links