Galton-problemet , opkaldt efter Sir Francis Galton , er problemet med at udlede fra tværkulturelle data baseret på et statistisk fænomen kendt i dag som netværksautokorrelation . Problemet er nu anerkendt som et generelt problem, der gælder for al ikke-eksperimentel forskning såvel som eksperimentelt design. Det kan enklest beskrives som et ydre problem i statistiske beregninger, hvor de udvalgte poster ikke er statistisk uafhængige. Spørger du for eksempel to personer i samme hus, om de ser tv, får du ikke statistisk uafhængige svar. Stikprøvestørrelsen, n, for uafhængige observationer i dette tilfælde er én, ikke to. Efter at have foretaget korrekte justeringer, vil dette allerede omhandle eksterne afhængigheder, og derefter vil sandsynlighedslærens aksiomer vedrørende statistisk afhængighed blive anvendt. Sådanne aksiomer er vigtige for at fastsætte kriterier for variabilitet (for eksempel) eller test for statistisk signifikans .
I 1888 var Galton til stede, da Sir Edward Tylor præsenterede sit arbejde på Royal Anthropological Institute. Tylor indsamlede oplysninger om institutionerne for ægteskab og arv for 350 kulturer og undersøgte også sammenhængen mellem disse institutioner og udviklingsniveauet for samfundsstrukturen. Tylor fortolkede hans resultater som at angive en generel evolutionær sekvens, hvor institutioner flyttede deres fokus fra moder til fader, efterhånden som samfundets sociale struktur udviklede sig. Galton var uenig og påpegede, at ligheder mellem kulturer kunne skyldes adoption, fælles afstamning eller evolutionær udvikling; han støttede ideen om, at uden at kontrollere for parametrene for låntagning og fælles herkomst, kan man ikke drage pålidelige konklusioner om evolutionær udvikling. Galtons kritik blev kendt som det eponyme Galton Problem , [1] :175 , som det blev kaldt af Raul Naroll , [2] [3] som foreslog de første statistiske løsninger.
I begyndelsen af det 20. århundrede var teorien om unilineær evolution blevet glemt, ligesom man kunne drage direkte slutninger fra evolutionære sekvenskorrelationer. Imidlertid har Galtons kritik bevist sin gyldighed til at udlede funktionelle sammenhænge fra korrelationer. Problemet med autokorrelation eksisterede stadig.
I 1914 udviklede statistikeren William S. Gosset metoder til at eliminere falske sammenhænge baseret på, hvordan placering i tid og rum påvirker graden af lighed. Nutidige meningsmålinger af den brede befolkning om valg viser et lignende problem: Jo tættere på valget, jo færre mennesker tænker uafhængigt, og jo højere er upålideligheden af afstemningsresultater, især fejlmarginen eller tillidsgrænser . Ydelsen af n uafhængige sager fra deres stikprøvepopulation falder, efterhånden som valget nærmer sig.
Statistisk signifikans falder i takt med lavere effektive stikprøvestørrelser.
Et problem opstår i stikprøveundersøgelser, hvor sociologer for at reducere interviewtiden opdeler befolkningen i lokale klynger og tilfældigt udtager på tværs af klynger og derefter igen stikprøver inden for klynger. Hvis de spørger n antal personer i en klynge af størrelse m, vil den effektive stikprøvestørrelse (efs) have en nedre grænse på 1 + (n − 1) / m, hvis alle i klyngen er identiske. Hvis der kun er delvis lighed inden for en klynge, vil m i den nuværende formel falde tilsvarende. Denne formeltype er 1 + d (n − 1), hvor d er intraklassekorrelationen for den pågældende statistik. [fire]
Generelt afhænger estimatet af de tilsvarende efs af den estimerede statistik, såsom middelværdi, chi-kvadrat, korrelation , regressionskoefficient og deres variationer . Til tværkulturelle undersøgelser estimerede Murdoch og White [5] størrelsen af lighedspletter i deres stikprøve på 186 samfund. De fire variabler, de undersøgte – sprog, økonomi, politisk integration og arv – havde lighedspletter, der varierede fra størrelse 3 til størrelse 10. En tommelfingerregel kan bruges til at dividere kvadratroden af lighedsplasterstørrelser med n, således at effektiv er prøvestørrelserne henholdsvis 58 og 107 for de givne plastre . Igen falder den statistiske signifikans med lavere effektive stikprøvestørrelser.
I moderne analyse modelleres rumlige forsinkelser for at vurdere niveauet af globalisering af moderne samfund. [6]
Rumlig korrelation, eller autokorrelation , er et grundlæggende begreb i geografi. Metoderne udviklet af geografer, der bruges til at måle og overvåge rumlig autokorrelation [7] [8] gør meget mere end blot at reducere den effektive værdi af n for at teste for betydningen af en korrelation. Et eksempel er en sofistikeret hypotese om, at "tilstedeværelsen af spil i et samfund er direkte proportional med tilstedeværelsen af kommercielle midler og tilstedeværelsen af betydelige socioøkonomiske forskelle, og er omvendt relateret til, om samfundet er et nomadisk hyrdesamfund eller ej. Tests af denne hypotese i en stikprøve på 60 samfund, var de ikke i stand til at forkaste nulhypotesen , men autokorrelationsanalyse viste en signifikant effekt af socioøkonomiske forskelle. [9]
Hvor almindelig er autokorrelation blandt de variabler, der overvejes i en tværkulturel undersøgelse? Anton Eff testede mod 1.700 variabler i en samlet database for Standard Cross-Cultural Sample offentliggjort i World Cultures og målte Morans I-indekset for rumlig autokorrelation (afstand), sproglig autokorrelation (fælles herkomst) og kulturel kompleksitets autokorrelation (grundlæggende evolution). "Resultaterne tyder på, at ... det ville være værd at teste for rumlig og fylogenetisk autokorrelation, når man udfører regressionsanalyser med Standard Cross-Cultural Sampling." [ti]
Brugen af autokorrelationstests i eksplorative dataanalyser er illustreret, hvilket afspejler, hvordan variablerne i en given undersøgelse kan vurderes i fravær af case-uafhængighed med hensyn til afstand, sprog og kulturel kompleksitet. Metoder til evaluering af disse autokorrelationseffekter forklares derefter og illustreres for almindelig mindste kvadraters regression ved anvendelse af et mål for betydningen af Morans I autokorrelationsindekset.
Hvis der er autokorrelation, kan det ofte elimineres at opnå et upartisk estimat af regressionskoefficienterne og deres variabler ved at konstruere en nulstillingsafhængig variabel, der "halter" ved at genvægte den afhængige variabel andre steder, hvor vægten er graden af sammenhæng. En sådan forsinkelsesafhængig variabel er endogen, og estimeringen kræver enten en to-trins mindste kvadraters metode eller en maksimal sandsynlighedsmetode. [elleve]
Når den offentlige server bruges eksternt på http://SocSciCompute.ss.uci.edu , tilbyder den etnografiske data, variabler og inferensværktøjer med R-scripts af Dow (2007) og Eff & Dow (2009) i NSF-understøttede projekter ( http://getgalaxy.org ) og ( https://www.xsede.org ) for undervisere, studerende og forskere til at udføre CoSSci (Integrated Social Science) tværkulturelle forskningssimuleringer, der kontrollerer problemet Galton gennem brug af standard tværkulturelle samplingsvariabler tilgængelige på https://web.archive.org/web/20160402201432/https://dl.dropboxusercontent.com/u/9256203/SCCScodebook.txt .
Inden for antropologien, hvor Tylor-problemet første gang blev anerkendt af statistikeren Galton i 1889, er det stadig ikke almindeligt accepteret, at der er standard statistiske justeringer for problemet med lighedspletter i observerede eksempler, og heller ikke muligheden for nye opdagelser ved hjælp af autokorrelationsteknikker. Nogle tværkulturelle forskere (se for eksempel Korotaev og de Munk, 2003) [12] konkluderer, at beviser for distribution, historisk oprindelse og andre kilder til lighed mellem beslægtede samfund og individer bør omdøbes til Galton Opportunity eller Galton Resource. frem for at blive kaldt Galton-problemet. Forskere bruger nu analyser af langsgående, tværkulturel og regional variation til rutinemæssigt at udforske konkurrerende hypoteser: funktionelle relationer, distribution, fælles historisk herkomst, multilineage-evolution, samtilpasning til miljøet og dynamikken i kompleks social interaktion . [13]
Inden for antropologien nævnes Galtons problem ofte som en årsag til afvisningen af sammenlignende undersøgelser. Da problemet er af generel karakter, fælles for videnskaberne og statistisk slutning generelt, fører en sådan specifik kritik af tværkulturelle eller komparative undersøgelser - og der er mange af dem - logisk set til en afvisning af videnskab og statistik taget sammen. Enhver data indsamlet og analyseret af for eksempel etnografer er også underlagt Galtons problem, forstået i bredeste forstand. Kritikken af anti-komparativ kritik er ikke begrænset til statistisk sammenligning, da den også vil gælde for tekstanalyse. Det vil sige, at analysen og brugen af teksten i argumentationen er genstand for kritik vedrørende konklusionernes evidensgrundlag. At stole udelukkende på retorik er ikke et forsvar mod kritik af gyldigheden af et argument og dets evidensgrundlag.
Der er dog næppe nogen tvivl om, at det tværkulturelle forskningsmiljø tilfældigt ignorerer Galtons problem. Ekspertforskning om emnet viser resultater, der "stærkt tyder på, at omfattende rapporter om naive tests af chi-square gensidig uafhængighed ved hjælp af tværkulturelle data i løbet af de sidste par årtier har afvist nulteorier på niveauer, der er væsentligt højere end forudsagt 5 %". [14] :247
Forskeren konkluderer, at "Ukorrekte teorier, der er blevet 'bevaret' af naive test af gensidig chi-kvadrat-uafhængighed ved hjælp af sammenlignende data, kan stadig testes strengt videnskabeligt i fremtiden." [14] :270 Igen er den justerede klyngestikprøvevariabel givet som sådan ganget med 1 + d (k + 1), hvor k er den gennemsnitlige klyngestørrelse, og den mere komplekse justering er givet som korrelationsvariablen for kryds- tabeller med r rækker og kolonner. Siden denne kritik blev offentliggjort i 1993, såvel som andre udsagn som den, er flere forfattere begyndt at tilpasse korrelationerne til Galton-problemet, men det gør de fleste specialister, der arbejder i det tværkulturelle felt, ikke. Følgelig er størstedelen af offentliggjorte resultater, der er afhængige af naive signifikanstests og tilpasser P < 0,05 snarere end P < 0,005-standarden, sandsynligvis fejlagtige, da de er mere tilbøjelige til type I-fejl, som afviser nulhypotesen, når den er rigtigt.
Nogle tværkulturelle forskere afviser alvoren af Galtons problem, fordi de mener, at korrelationsestimater og -midler kan være objektive, selvom der er autokorrelation (hvad enten det er svag eller stærk). Uden en autokorrelationsundersøgelse kan de dog stadig fejlbedømme statistikker om sammenhænge mellem variabler. I regressionsanalyse, for eksempel, kan undersøgelse af mønstre af autokorrelerede residualer give vigtige ledetråde til tredje faktorer, der kan påvirke sammenhænge mellem variabler, men som ikke var inkluderet i regressionsmodellen. For det andet, hvis der er klynger af lignende eller beslægtede samfund i stikprøven, vil variansmålinger blive undervurderet, hvilket fører til vildledende statistiske konklusioner, såsom at overvurdere den statistiske signifikans af korrelationer. For det tredje gør undervurdering af varians det vanskeligt at kontrollere for replikering af resultater fra to forskellige prøver, da resultater ofte vil blive afvist som ens.