En prøve eller et stikprøvesæt er en del af det generelle sæt af elementer, der er dækket af et eksperiment (observation, undersøgelse).
Prøveegenskaber:
En sekvens af uafhængige tilfældige variable, der svarer til alle mulige resultater af statistiske eksperimenter og har samme sandsynlighedsfordelingslov med en tilfældig variabel , kaldes en stikprøvestørrelse genereret af en tilfældig variabel [1] . Hvis er en diskret tilfældig variabel , så er en stikprøve af volumen en hvilken som helst delmængde af objekter af den generelle population af volumen , valgt med lige stor sandsynlighed blandt alle sådanne delmængder [1] .
Prøvestørrelse er antallet af sager, der indgår i stikprøven.
Prøver kan betinget opdeles i store og små, da der anvendes forskellige tilgange i matematisk statistik afhængigt af stikprøvestørrelsen. Det menes, at prøver større end 30 kan klassificeres som store [2] .
Når man sammenligner to (eller flere) prøver, er deres afhængighed en vigtig parameter. Hvis det er muligt at etablere et homomorft par (det vil sige, når et tilfælde fra prøve X svarer til et og kun et tilfælde fra prøve Y og omvendt) for hvert tilfælde i to prøver (og dette forhold er vigtigt for egenskaben målt i prøverne), kaldes sådanne prøver afhængige . Eksempler på afhængige valg:
Hvis der ikke er et sådant forhold mellem prøverne, betragtes disse prøver som uafhængige , for eksempel:
Derfor har afhængige stikprøver altid samme størrelse, mens størrelsen af uafhængige stikprøver kan variere.
Prøver sammenlignes ved hjælp af forskellige statistiske kriterier :
Stikprøven kan betragtes som repræsentativ eller ikke-repræsentativ. Stikprøven vil være repræsentativ ved undersøgelse af en stor gruppe mennesker, hvis der inden for denne gruppe er repræsentanter for forskellige undergrupper, kun på denne måde kan der drages korrekte konklusioner.
I USA er et af de mest berømte historiske eksempler på ikke-repræsentativ prøveudtagning det tilfælde, der fandt sted under præsidentvalget i 1936 [3] . The Litrery Digest, som med succes havde forudsagt begivenhederne ved flere tidligere valg, fejlbedømte sine forudsigelser ved at sende ti millioner testsedler til sine abonnenter såvel som til personer udvalgt fra telefonbøgerne i hele landet og personer fra bilregistreringslister. I 25 % af de returnerede stemmesedler (næsten 2,5 millioner) var stemmerne fordelt som følger:
Roosevelt vandt som bekendt selve valget med mere end 60 % af stemmerne. The Litreary Digests fejl var denne: de ønskede at øge repræsentativiteten af stikprøven - fordi de vidste, at de fleste af deres abonnenter betragtede sig selv som republikanere - udvidede de stikprøven med personer udvalgt fra telefonbøger og registreringslister. De tog dog ikke højde for samtidens realiteter og rekrutterede faktisk endnu flere republikanere: under den store depression var det for det meste middel- og overklassen (det vil sige de fleste republikanere, ikke demokrater), der havde råd til at eje telefoner og biler .
Der er flere hovedtyper af gruppebyggeplaner [4] :
Prøver er opdelt i to typer:
Anvendelsen af en sådan stikprøve er baseret på den antagelse, at hver respondent er lige sandsynligt inkluderet i stikprøven. Ud fra listen over den almindelige befolkning sammenstilles kort med antallet af respondenter. De placeres i et kortspil, blandes, og et kort tages tilfældigt ud af dem, et tal skrives ned og returneres derefter. Yderligere gentages proceduren lige så mange gange som den prøvestørrelse, vi har brug for. Minus: gentagelse af udvælgelsesenheder.
Proceduren til at konstruere en simpel tilfældig prøve omfatter følgende trin:
1) det er nødvendigt at indhente en komplet liste over medlemmer af den almindelige befolkning og nummerere denne liste. En sådan liste, genkald, kaldes sampling-rammen;
2) bestemme den forventede stikprøvestørrelse, det vil sige det forventede antal respondenter;
3) udtræk så mange tal fra tabellen med tilfældige tal, som vi har brug for prøveenheder. Hvis stikprøven skal omfatte 100 personer, tages 100 tilfældige tal fra tabellen. Disse tilfældige tal kan genereres af et computerprogram.
4) vælg fra basislisten de observationer, hvis tal svarer til de skrevne tilfældige tal
1) det er ofte vanskeligt at skabe en stikprøveramme, der giver mulighed for en simpel tilfældig stikprøve.
2) resultatet af at anvende en simpel tilfældig stikprøve kan være en stor population eller en population fordelt over et stort geografisk område, hvilket markant øger tiden og omkostningerne ved dataindsamling.
3) resultaterne af at anvende en simpel tilfældig stikprøve er ofte karakteriseret ved lav nøjagtighed og en større standardfejl end resultaterne af anvendelse af andre probabilistiske metoder.
4) som et resultat af anvendelsen af SRS kan der dannes en ikke-repræsentativ prøve. Selvom prøverne opnået ved simpel tilfældig udvælgelse i gennemsnit repræsenterer den generelle befolkning tilstrækkeligt, repræsenterer nogle af dem ekstremt ukorrekt den undersøgte population. Sandsynligheden for dette er især høj med en lille stikprøvestørrelse.
Simpel hentning uden genafspilningProceduren for at konstruere prøven er den samme, kun kortene med numrene på respondenterne returneres ikke tilbage til bunken.
Udvælgelsen i en sådan prøve udføres ikke efter tilfældighedsprincipperne, men efter subjektive kriterier - tilgængelighed, typiskhed, lige repræsentation osv.
Udvælgelsen af grupper til deres deltagelse i et psykologisk eksperiment udføres ved hjælp af forskellige strategier, der er nødvendige for at sikre den højest mulige overensstemmelse med intern og ekstern validitet [5] .
Randomisering eller tilfældig udvælgelse bruges til at skabe simple tilfældige prøver. Anvendelsen af en sådan stikprøve er baseret på den antagelse, at hvert medlem af befolkningen er lige sandsynligt, at de indgår i stikprøven. For at lave en tilfældig prøve på 100 universitetsstuderende kan du for eksempel lægge papirer med navnene på alle universitetsstuderende i en hat og derefter tage 100 stykker papir ud af det - dette vil være tilfældigt udvalg (Goodwin J., s. . 147)……
parvis udvælgelse er en strategi til at konstruere prøvegrupper, hvor grupper af forsøgspersoner består af emner, der er ækvivalente med hensyn til sideparametre, der er signifikante for eksperimentet. Denne strategi er effektiv til eksperimenter med forsøgs- og kontrolgrupper med den bedste mulighed - at tiltrække tvillingepar ( mono- og tveæggede ).
Stratometrisk udvælgelse - randomisering med udvælgelse af lag (eller klynger ). Med denne prøveudtagningsmetode opdeles den generelle befolkning i grupper (strata), der har bestemte karakteristika ( køn , alder , politiske præferencer, uddannelse , indkomstniveau osv.), og fag med de tilsvarende karakteristika udvælges.
Tilnærmet modellering - udarbejdelse af begrænsede stikprøver og generalisering af konklusionerne om denne prøve til en større population. For eksempel, når du deltager i en undersøgelse af 2. års universitetsstuderende , udvides dataene fra denne undersøgelse til "personer i alderen 17 til 21 år". Antageligheden af sådanne generaliseringer er yderst begrænset.
Approksimativ modellering er dannelsen af en model, der for en klart defineret klasse af systemer (processer) beskriver dens adfærd (eller ønskede fænomener) med acceptabel nøjagtighed.