Dickey-Fuller-testen (DF-test, Dickey-Fuller-test) er en teknik, der bruges i anvendt statistik og økonometri til at analysere tidsserier for at teste for stationaritet. Det er en af testene for enhedsrødder ( Unit root test ). Det blev foreslået i 1979 af David Dickey og Wayne Fuller [1] .
For sit bidrag til studiet af kointegrerede processer ved hjælp af den foreslåede Dickey-Fuller-test for stationaritet modtog Clive Granger i 2003 Nobelprisen i økonomi . [2]
Tidsserien har en enhedsrod, eller integrationsrækkefølgen er den samme, hvis dens første forskelle danner en stationær række. Denne betingelse skrives som om den første differensserie er stationær .
Denne test kontrollerer værdien af koefficienten i den førsteordens autoregressive ligning AR(1)
hvor er tidsserien og er fejlen.
Hvis , så har processen en enhedsrod, i dette tilfælde er serien ikke stationær, det er en integreret tidsserie af første orden - . Hvis , så er serien stationær - .
For finansielle og økonomiske processer er værdien ikke typisk, da processen i dette tilfælde er "eksplosiv". Forekomsten af sådanne processer er usandsynlig, da det finansielle og økonomiske miljø er ret inerti, hvilket ikke tillader at acceptere uendeligt store værdier i korte perioder.
Ovenstående autoregressive ligning AR(1) kan omskrives som: [3]
hvor , og er førsteordens forskelsoperator .
Derfor betyder test af hypotesen om en enhedsrod i denne repræsentation at teste nulhypotesen om , at koefficienten er lig med nul . Da tilfældet med "eksplosive" processer er udelukket, er testen ensidig, det vil sige, at den alternative hypotese er hypotesen om, at koefficienten er mindre end nul. Teststatistikken (DF-statistik) er en almindelig statistik til at teste signifikansen af lineære regressionskoefficienter . Fordelingen af denne statistik adskiller sig dog fra den klassiske fordeling af -statistik (Studens t- fordeling eller asymptotisk normalfordeling). Fordelingen af DF-statistikken er udtrykt i form af Wiener-processen og kaldes Dickey-Fuller-fordelingen.
Der er tre versioner af testen (testregression):
For hver af de tre testregressioner er der kritiske værdier af DF - statistik, som er taget fra en speciel Dickey-Fuller (McKinnon) tabel. Hvis værdien af statistikken ligger til venstre for den kritiske værdi (kritiske værdier er negative) på et givet signifikansniveau, så forkastes nulhypotesen om en enhedsrod, og processen betragtes som stationær (i denne forstand prøve). Ellers afvises hypotesen ikke, og processen kan indeholde enhedsrødder, det vil sige være en ikke-stationær (integreret) tidsserie.
Kritiske værdier af Dickey-Fuller-statistikker på 1% signifikansniveau
Prøvestørrelse | AR model | AR-model med en konstant | AR-model med konstant og trend |
---|---|---|---|
25 | -2,66 | -3,75 | -4,38 |
halvtreds | -2,62 | -3,58 | -4.15 |
100 | -2,60 | -3,51 | -4.04 |
-2,58 | -3,43 | -3,96 |
Til sammenligning er den kritiske værdi af Elevens fordeling for alle modeller på store stikprøvestørrelser 2,33, på små prøver - 2,5. McKinnon udledte også omtrentlige formler til at estimere kritiske værdier.
Hvis forsinkelser af de første forskelle i tidsserien lægges til testregressionerne, vil fordelingen af DF-statistikken (og dermed de kritiske værdier) ikke ændre sig. Sådan en test kaldes den udvidede Dickey-Fuller-test (Augmented DF, ADF).
Behovet for at inkludere forsinkelserne for de første forskelle skyldes, at processen kan være en autoregression, ikke af den første, men af en højere orden. Overvej eksemplet med AR(2)-modellen:
Denne model kan repræsenteres som:
Hvis tidsserien har én enhedsrod, så er de første forskelle per definition stationære. Og da den ved antagelse er ikke-stationær, så hvis koefficienten for den ikke er lig med nul, er ligningen inkonsekvent. Ud fra antagelsen om førsteordens integration for en sådan serie følger det således, at . For at kontrollere tilstedeværelsen af enhedsrødder i denne model bør der således udføres en standard DF-test for koefficienten ved , og forsinkelsen af den første forskel af den afhængige variabel bør tilføjes til testregressionen.
Ud over den angivne årsag er der også en anden model-fejl er muligvis ikke hvid støj , men er en stationær ARMA-proces , så du bør tjekke for en enhedsrod for flere forsinkelser. Det skal dog tages i betragtning, at en stigning i antallet af forsinkelser fører til et fald i testens kraft. Normalt begrænset til tre eller fire forsinkelser.
Dickey-Fuller-testen kontrollerer, ligesom mange andre test, for tilstedeværelsen af kun én enhedsrod. En proces kan dog teoretisk set have flere enhedsrødder. I dette tilfælde kan testen være forkert. Da det normalt antages, at mere end tre enhedsrødder næppe kan forekomme i realøkonomiske tidsserier, er det teoretisk berettiget først og fremmest at teste rækkens anden forskelle. Hvis enhedsrodhypotesen for denne serie forkastes, testes enhedsroden i de første forskelle. Hvis hypotesen ikke afvises på dette stadium, så har den originale serie to enhedsrødder. Hvis den afvises, så kontrolleres enhedsroden i selve tidsserien, som beskrevet ovenfor. I praksis foregår alt ofte i omvendt rækkefølge, hvilket ikke er helt korrekt. Korrekte konklusioner kræver testresultater for den anden og første forskel sammen med selve tidsserien.