Syntetisk kontrolmetode ( SCM ) er en økonometrisk metode til dataanalyse inden for Rubin kausal model , som tillader kausal slutning i komparative casestudier . Metoden er rettet mod at vurdere virkningerne af den undersøgte effekt (f.eks. økonomisk reform ) på eksemplet med et lille antal tilfælde ved at modellere deres kvantitative indikatorer i en hypotetisk situation, hvor virkningen ikke blev foretaget, baseret på et begrænset interval af lignende kontrolobservationer ved at tillægge visse vægte til disse variable.
Overvej regionen eller et andet observationsobjekt, og hvor er antallet af regioner, hvoraf 1 oplevede den undersøgte påvirkning, og resten ikke, da det er kontrolgruppen (deres helhed kaldes "donorpuljen", engelsk donorpulje ), i tidsrummet , hvor .
Lad den undersøgte effekt angives i perioden , hvor , og derefter - antallet af perioder før påvirkningen. Lad os udpege responsen af indikatoren i regionen i tidsrummet i fravær af den undersøgte effekt som , og i dens tilstedeværelse - . Lad os antage, at ved , : før virkningen under undersøgelse, har det ingen effekt på responsen i den valgte region. Vi antager også, at den påvirkning, der fandt sted i den pågældende region, ikke påvirker regionerne fra kontrolgruppen. Effekten af den undersøgte effekt vil blive betegnet som . Da påvirkningen kun forekommer i og , er målet med SCM at bestemme , hvor er den observerede indikator i den pågældende region, og er den uobserverede respons, som kan repræsenteres som følgende faktorielle model :
hvor er en faktor, der er fælles for alle regioner, er en vektor af observerbare, der er uafhængige af virkningerne af kovariater, er en vektor af deres koefficienter estimeret for en given prøve af regioner, er en vektor af uobserverede latente faktorer, er en vektor af faktor belastninger svarende til dem, og er specificitet eller støj. Denne model kan omskrives som:
hvor er den -th værdi af vektoren sådan at . Den syntetiske kontrolmetode består i at vælge et sådant sæt af vægte , at for , (det vil sige før eksponering, holder vægtene de observerede responsværdier uændrede) og (og på samme tid giver disse vægte os mulighed for nøjagtigt at modellere kovariaterne af regionen under overvejelse gennem kovariaterne af regionerne i kontrolgruppen).
Det er blevet vist i litteraturen, at hvis specificitetsafvigelser er ubetydelige for en given forbehandlingsperiodestørrelse , så er forskellen mellem en modelleret, uobserverbar respons i fravær af en stimulus og en vægtet, men observeret respons i dens tilstedeværelse ubetydelig under sådanne forhold. . Følgelig foreslås følgende vurdering af påvirkningseffekten ( ) [2] :494-495 :
Fra et beregningsmæssigt synspunkt er beregningen af de ønskede vægte forbundet med minimering af normens vægtvektor , hvor er vektoren af kovariatværdier for den region, der undersøges op til øjeblikket , og er matrixen for kovariat værdier for kontrolområderne. Uanset forskerens valg af en positiv bestemt matrix , afsløres den optimerede norm som [2] :496 .
For at opnå en slutværdi på , udføres en ekstern optimering på parameteren ved hjælp af en diskonteringsfaktor, der øger vægten af de seneste observationer. Denne optimering kan beskrives som følger: , hvor er minimumvægtsvektoren opnået i det foregående trin [3] :616 .
Bestemmelse af den statistiske signifikans af de opnåede estimater kan udføres ved hjælp af forskellige teknikker. I en artikel fra 2003, der vurderede virkningen af terrorisme og andre manifestationer af politisk vold på økonomien i Baskerlandet , blev den beregnede effekt udsat for den såkaldte. en placebotest (placebotest), som bestod i implementeringen af en identisk syntetisk kontrolalgoritme til Catalonien , også kendt for sin betydelige separatistbevægelse , men uden problemer med denne bevægelses terrormanifestationer [4] .
Placebotests i litteraturen ved hjælp af den syntetiske kontrolmetode er et eksempel på ikke-parametriske permutationstests . Syntetisk responsmodellering for alle kontroltilfælde i stikprøven giver dig mulighed for eksplicit at arbejde med sandsynlighedsfordelingen og teste nulhypotesen om fraværet af kausale virkninger i det pågældende tilfælde. Samtidig er der ikke behov for asymptotisk at tilnærme fordelingen af disse effekter i kontroltilfælde til en bestemt fordeling, hvilket gør tests af denne type permutationelle [5] .
I litteraturen er det blevet foreslået at bruge SCM ikke kun til at vurdere årsagssammenhænge, men også til at lave forudsigelser. Som en del af en pilotundersøgelse blev der forsøgt at forudsige økonomisk vækst i USA , dog bestod "donorpuljen", der blev brugt til at opnå vægte, ikke længere af lande med lignende karakteristika, men af økonomiske vækstindikatorer med en vis tidsforsinkelse [ 3] :616 .
Syntetisk kontrol kombinerer elementer fra andre kausale statistiske metoder: forskel på forskelle og matchende .
Sammenlignet med forskelle, tilbyder syntetisk kontrol en mere strømlinet procedure for tilpasning af vægte til observationer fra kontrolgruppen, bruger et længere tidsinterval før eksponering og kræver, at kontrolgruppens egenskaber er så tæt som muligt på objektets karakteristika under undersøgelse under udvælgelsen af vægte.
Den syntetiske kontrolmetode har en række ligheder med lineær regression . Tilsvarende forudsætter både syntetisk kontrol og regressionsanalyse en lineær kombination af vægte og variable (i sidstnævnte omtales vægtene normalt som regressionskoefficienter), hvor summen af vægtene er lig med 1. Den væsentligste forskel er, at i SCM . værdierne af disse vægte er indeholdt i , mens der i regressionsanalyse ikke er en sådan begrænsning, og koefficienterne fortolkes praktisk talt ikke som vægte [ 1 ] : 498-499 overskudsprodukt fra Østrig (42%), USA (22 ) %), Japan (16 %), Schweiz (11 %) og Holland (9 %) [6] .
Simuleringer har vist, at panel Xiao-metoden (Fixed Effects with Interaction Effects ) til at undersøge kausale virkninger er mindre robust over for ændringer i donorpuljen end den syntetiske kontrol, selvom begge tilgange fører til tilfredsstillende resultater. Det er blevet bemærket, at en syntetisk kontrol er at foretrække, hvis investigator har data om yderligere tidsperioder [7] :1001 [8] .
Omfanget af den syntetiske kontrolmetode omfatter sundhedspolitisk forskning [9] , kriminologi [10] , statskundskab [1] , forskellige dele af økonomien .
I statskundskab ses SCM som et kompromis mellem konventionelle kvantitative og kvalitative metoder, der giver dig mulighed for at kombinere fokus på en eller flere cases med strenge kriterier for deres udvælgelse. Ved hjælp af denne metode studerede vi: den økonomiske effekt af Tysklands forening for selve BRD [1] , konsekvenserne af den føderale reform i Belgien for udgifterne til social sikring [11] .
I geografi bruges SCM i studier af menneskeskabte landskaber (inden for landsystemvidenskab ) [12] :513 .
Der er pakker til at analysere data gennem den syntetiske kontrolmetode i statistisk software . En pakke [13] er blevet udviklet til R -sproget . Synth