Prøve

En prøve eller et stikprøvesæt er en del af det generelle sæt af elementer, der er dækket af et eksperiment (observation, undersøgelse).

Prøveegenskaber:

Kvalitative egenskaber ved prøven - hvad vi præcist vælger, og hvilke prøveudtagningsmetoder vi bruger til dette.
Det kvantitative kendetegn ved stikprøven er, hvor mange tilfælde vi udvælger, med andre ord stikprøvestørrelsen.

Sampling i matematisk statistik

En sekvens af uafhængige tilfældige variable, der svarer til alle mulige resultater af statistiske eksperimenter og har samme sandsynlighedsfordelingslov med en tilfældig variabel , kaldes en stikprøvestørrelse genereret af en tilfældig variabel [1] . Hvis er en diskret tilfældig variabel , så er en stikprøve af volumen en hvilken som helst delmængde af objekter af den generelle population af volumen , valgt med lige stor sandsynlighed blandt alle sådanne delmængder [1] . ${\displaystyle x_{1},x_{2},...,x_{n))$ $n$ $\xi$ $n$ $\xi$ $\xi$ $n$ $n$ $N$

Prøvestørrelse

Prøvestørrelse er antallet af sager, der indgår i stikprøven.

Prøver kan betinget opdeles i store og små, da der anvendes forskellige tilgange i matematisk statistik afhængigt af stikprøvestørrelsen. Det menes, at prøver større end 30 kan klassificeres som store [2] .

Afhængige og uafhængige prøver

Når man sammenligner to (eller flere) prøver, er deres afhængighed en vigtig parameter. Hvis det er muligt at etablere et homomorft par (det vil sige, når et tilfælde fra prøve X svarer til et og kun et tilfælde fra prøve Y og omvendt) for hvert tilfælde i to prøver (og dette forhold er vigtigt for egenskaben målt i prøverne), kaldes sådanne prøver afhængige . Eksempler på afhængige valg:

tvillingepar
to målinger af enhver funktion før og efter eksperimentel eksponering,
mænd og koner
etc.

Hvis der ikke er et sådant forhold mellem prøverne, betragtes disse prøver som uafhængige , for eksempel:

mænd og kvinder _
psykologer og matematikere .

Derfor har afhængige stikprøver altid samme størrelse, mens størrelsen af uafhængige stikprøver kan variere.

Prøver sammenlignes ved hjælp af forskellige statistiske kriterier :

Pearson-kriterium ( χ 2 )
Elevens t-test ( t )
Wilcoxon test ( T )
Mann-Whitney test ( U )
Tegnkriterium ( G )
og osv.

Repræsentativitet

Stikprøven kan betragtes som repræsentativ eller ikke-repræsentativ. Stikprøven vil være repræsentativ ved undersøgelse af en stor gruppe mennesker, hvis der inden for denne gruppe er repræsentanter for forskellige undergrupper, kun på denne måde kan der drages korrekte konklusioner.

Et eksempel på en ikke-repræsentativ prøve

I USA er et af de mest berømte historiske eksempler på ikke-repræsentativ prøveudtagning det tilfælde, der fandt sted under præsidentvalget i 1936 [3] . The Litrery Digest, som med succes havde forudsagt begivenhederne ved flere tidligere valg, fejlbedømte sine forudsigelser ved at sende ti millioner testsedler til sine abonnenter såvel som til personer udvalgt fra telefonbøgerne i hele landet og personer fra bilregistreringslister. I 25 % af de returnerede stemmesedler (næsten 2,5 millioner) var stemmerne fordelt som følger:

57 % foretrak den republikanske kandidat Alf Landon
40 % valgte den daværende demokratiske præsident Franklin Roosevelt

Roosevelt vandt som bekendt selve valget med mere end 60 % af stemmerne. The Litreary Digests fejl var denne: de ønskede at øge repræsentativiteten af stikprøven - fordi de vidste, at de fleste af deres abonnenter betragtede sig selv som republikanere - udvidede de stikprøven med personer udvalgt fra telefonbøger og registreringslister. De tog dog ikke højde for samtidens realiteter og rekrutterede faktisk endnu flere republikanere: under den store depression var det for det meste middel- og overklassen (det vil sige de fleste republikanere, ikke demokrater), der havde råd til at eje telefoner og biler .

Typer af plan til at konstruere grupper fra prøver

Der er flere hovedtyper af gruppebyggeplaner [4] :

Undersøgelse med forsøgs- og kontrolgrupper, som placeres under forskellige forhold.
- Undersøg med eksperimentelle grupper og kontrolgrupper ved hjælp af en parret udvælgelsesstrategi
En undersøgelse med kun én gruppe - eksperimentel.
En undersøgelse med en blandet (faktoriel) plan - alle grupper placeres under forskellige forhold.

Eksempeltyper

Prøver er opdelt i to typer:

probabilistisk
usandsynlighed

Sandsynlighedsprøver

Simpel resampling

Anvendelsen af en sådan stikprøve er baseret på den antagelse, at hver respondent er lige sandsynligt inkluderet i stikprøven. Ud fra listen over den almindelige befolkning sammenstilles kort med antallet af respondenter. De placeres i et kortspil, blandes, og et kort tages tilfældigt ud af dem, et tal skrives ned og returneres derefter. Yderligere gentages proceduren lige så mange gange som den prøvestørrelse, vi har brug for. Minus: gentagelse af udvælgelsesenheder.

Proceduren til at konstruere en simpel tilfældig prøve omfatter følgende trin:

1) det er nødvendigt at indhente en komplet liste over medlemmer af den almindelige befolkning og nummerere denne liste. En sådan liste, genkald, kaldes sampling-rammen;

2) bestemme den forventede stikprøvestørrelse, det vil sige det forventede antal respondenter;

3) udtræk så mange tal fra tabellen med tilfældige tal, som vi har brug for prøveenheder. Hvis stikprøven skal omfatte 100 personer, tages 100 tilfældige tal fra tabellen. Disse tilfældige tal kan genereres af et computerprogram.

4) vælg fra basislisten de observationer, hvis tal svarer til de skrevne tilfældige tal

En simpel stikprøve har indlysende fordele. Denne metode er ekstremt let at forstå. Resultaterne af undersøgelsen kan udvides til undersøgelsespopulationen. De fleste tilgange til statistisk inferens involverer indsamling af information ved hjælp af en simpel tilfældig stikprøve. Den simple stikprøvemetode har dog mindst fire væsentlige begrænsninger:

1) det er ofte vanskeligt at skabe en stikprøveramme, der giver mulighed for en simpel tilfældig stikprøve.

2) resultatet af at anvende en simpel tilfældig stikprøve kan være en stor population eller en population fordelt over et stort geografisk område, hvilket markant øger tiden og omkostningerne ved dataindsamling.

3) resultaterne af at anvende en simpel tilfældig stikprøve er ofte karakteriseret ved lav nøjagtighed og en større standardfejl end resultaterne af anvendelse af andre probabilistiske metoder.

4) som et resultat af anvendelsen af SRS kan der dannes en ikke-repræsentativ prøve. Selvom prøverne opnået ved simpel tilfældig udvælgelse i gennemsnit repræsenterer den generelle befolkning tilstrækkeligt, repræsenterer nogle af dem ekstremt ukorrekt den undersøgte population. Sandsynligheden for dette er især høj med en lille stikprøvestørrelse.

Simpel hentning uden genafspilning

Proceduren for at konstruere prøven er den samme, kun kortene med numrene på respondenterne returneres ikke tilbage til bunken.

Systematisk sandsynlighedsstikprøve. Det er en forenklet version af en simpel sandsynlighedsprøve. Baseret på listen over den generelle befolkning udvælges respondenter med et bestemt interval (K). Værdien af K bestemmes tilfældigt. Det mest pålidelige resultat opnås med en homogen generel population, ellers kan trinstørrelsen og nogle interne cykliske mønstre i prøven falde sammen (prøveblanding). Ulemper: det samme som i en simpel sandsynlighedsprøve.
Seriel (indlejret) prøveudtagning. Stikprøveenhederne er statistiske serier (familie, skole, hold osv.). De udvalgte elementer gennemgås løbende. Udvælgelsen af statistiske enheder kan organiseres efter typen af tilfældig eller systematisk stikprøve. Ulemper: Mulighed for større homogenitet end i befolkningen generelt.
Zoneinddelt prøve. I tilfælde af en heterogen population anbefales det at opdele populationen i homogene dele, før man anvender sandsynlighedsprøvetagning med en hvilken som helst selektionsteknik, en sådan prøve kaldes en zoneinddelt prøve. Zonegrupperne kan både være naturlige formationer (for eksempel bydele) og ethvert træk, der ligger til grund for undersøgelsen. Skiltet som opdelingen foretages på grundlag af kaldes lagdelings- og zoneinddelingens tegn.
"Bekvemt" valg. Proceduren for "bekvemmelig" prøveudtagning består i at etablere kontakter med "bekvemmelige" prøveudtagningsenheder - en gruppe studerende, et sportshold, venner og naboer. Hvis det er nødvendigt at indhente oplysninger om folks reaktioner på et nyt koncept, er en sådan prøve ganske rimelig. "Bekvemmelig" prøvetagning bruges ofte til foreløbig test af spørgeskemaer.

Utrolige prøver

Udvælgelsen i en sådan prøve udføres ikke efter tilfældighedsprincipperne, men efter subjektive kriterier - tilgængelighed, typiskhed, lige repræsentation osv.

Kvoteudtagning - stikprøven er opbygget som en model, der gengiver strukturen i den generelle befolkning i form af kvoter (andele) af de undersøgte karakteristika. Antallet af stikprøveelementer med en forskellig kombination af de undersøgte karakteristika er bestemt på en sådan måde, at det svarer til deres andel (andel) i den generelle befolkning. Så hvis vi for eksempel har en generel befolkning på 5.000 mennesker, heraf 2.000 kvinder og 3.000 mænd, så vil vi i kvoteprøven have 20 kvinder og 30 mænd eller 200 kvinder og 300 mænd. Kvoteprøver er oftest baseret på demografiske kriterier: køn, alder, region, indkomst, uddannelse og andre. Ulemper: Normalt er sådanne prøver ikke repræsentative, da det er umuligt at tage højde for flere sociale parametre på én gang. Fordele: let tilgængeligt materiale.
Snebold metode. Prøven er konstrueret som følger. Hver respondent, begyndende med den første, bliver bedt om at kontakte sine venner, kolleger, bekendte, som ville passe til udvælgelsesbetingelserne og kunne deltage i undersøgelsen. Med undtagelse af det første trin dannes prøven således med deltagelse af selve undersøgelsesobjekterne. Metoden bruges ofte, når det er nødvendigt at finde og interviewe svært tilgængelige grupper af respondenter (f.eks. respondenter med høj indkomst, respondenter, der tilhører samme faggruppe, respondenter, der har nogle lignende hobbyer/passioner mv. )
Spontan prøvetagning - prøveudtagning af den såkaldte "førstekommer". Bruges ofte i tv- og radioafstemninger. Størrelsen og sammensætningen af spontane prøver kendes ikke på forhånd og bestemmes kun af én parameter - respondenternes aktivitet. Ulemper: det er umuligt at afgøre, hvilken generel befolkning de adspurgte repræsenterer, og som følge heraf er det umuligt at bestemme repræsentativitet.
Ruteundersøgelse - bruges ofte, hvis studieenheden er familien. På kortet over den bebyggelse, hvor undersøgelsen skal foretages, er alle gader nummereret. Ved hjælp af en tabel (generator) af tilfældige tal vælges store tal. Hvert stort tal anses for at bestå af 3 komponenter: vejnummer (2-3 første numre), husnummer, lejlighedsnummer. Eksempelvis nummeret 14832: 14 er vejnummeret på kortet, 8 er husnummeret, 32 er lejlighedens nummer.
Zoned prøvetagning med udvælgelse af typiske objekter. Hvis der efter zoneinddeling vælges et typisk objekt fra hver gruppe, det vil sige et objekt, der nærmer sig gennemsnittet for de fleste af de undersøgte egenskaber i undersøgelsen, kaldes en sådan prøve zoneinddelt med udvælgelsen af typiske objekter.
modal valg.
Ekspertprøve.
heterogen prøve.

Gruppeopbygningsstrategier

Udvælgelsen af grupper til deres deltagelse i et psykologisk eksperiment udføres ved hjælp af forskellige strategier, der er nødvendige for at sikre den højest mulige overensstemmelse med intern og ekstern validitet [5] .

Randomisering (tilfældigt udvalg)
Parvis valg
Stratometrisk udvælgelse
Omtrentlig modellering
Engagerende rigtige grupper

Randomisering

Randomisering eller tilfældig udvælgelse bruges til at skabe simple tilfældige prøver. Anvendelsen af en sådan stikprøve er baseret på den antagelse, at hvert medlem af befolkningen er lige sandsynligt, at de indgår i stikprøven. For at lave en tilfældig prøve på 100 universitetsstuderende kan du for eksempel lægge papirer med navnene på alle universitetsstuderende i en hat og derefter tage 100 stykker papir ud af det - dette vil være tilfældigt udvalg (Goodwin J., s. . 147)……

Parvis valg

parvis udvælgelse er en strategi til at konstruere prøvegrupper, hvor grupper af forsøgspersoner består af emner, der er ækvivalente med hensyn til sideparametre, der er signifikante for eksperimentet. Denne strategi er effektiv til eksperimenter med forsøgs- og kontrolgrupper med den bedste mulighed - at tiltrække tvillingepar ( mono- og tveæggede ).

Stratometrisk udvælgelse

Stratometrisk udvælgelse - randomisering med udvælgelse af lag (eller klynger ). Med denne prøveudtagningsmetode opdeles den generelle befolkning i grupper (strata), der har bestemte karakteristika ( køn , alder , politiske præferencer, uddannelse , indkomstniveau osv.), og fag med de tilsvarende karakteristika udvælges.

Tilnærmet modellering

Tilnærmet modellering - udarbejdelse af begrænsede stikprøver og generalisering af konklusionerne om denne prøve til en større population. For eksempel, når du deltager i en undersøgelse af 2. års universitetsstuderende , udvides dataene fra denne undersøgelse til "personer i alderen 17 til 21 år". Antageligheden af sådanne generaliseringer er yderst begrænset.

Approksimativ modellering er dannelsen af en model, der for en klart defineret klasse af systemer (processer) beskriver dens adfærd (eller ønskede fænomener) med acceptabel nøjagtighed.

Noter

↑ 1 2 Matalytsky M.A., Khatskevich G.A. Sandsynlighedsteori, matematisk statistik og tilfældige processer. - Minsk: Higher School, 2012. - S. 518. - 720 s.
↑ Ivanovsky R. Sandsynlighedsteori og matematisk statistik. Fundamentals, anvendte aspekter med eksempler og opgaver i Mathcad miljøet. - S. 528. - 528 s. — ISBN 978-5-9775-0199.
↑ Forskning i psykologi: metoder og planlægning / J. Goodwin. - Skt. Petersborg: Peter, 2004. S. 146.
↑ Druzhinin V. N. Eksperimentel psykologi. - 2. udg., tilføje. - Skt. Petersborg: Peter, 2002. S. 92
↑ Se ibid. s. 93-95.

Litteratur

Ilyasov FN Repræsentativitet af undersøgelsesresultater i marketingforskning // Sociologisk forskning . 2011. nr. 3. S. 112-116.
Ilyasov F. N. Det omvendte problem med prøveudtagning og motivation på Forex-markedet // Social Research. 2016. nr. 2. S. 49-59.
Ilyasov FN Algoritmer til at danne et udsnit af en sociologisk undersøgelse // Social Research. 2017. nr. 2. S. 60-75.
Nasledov AD Matematiske metoder til psykologisk forskning. - Skt. Petersborg: Tale, 2004.
Ostapenko RI Matematiske grundlag for psykologi . - Voronezh .: VSPU , 2010. - 76 s.