Den Lagged Distribuerte Autoregressive (ADR) modellen, fra engelsk Autoregressiv distribuert lagmodell(ADL), er en regresjon som involverer en ny forsinket uavhengig variabel i tillegg til den forsinkede avhengige variabelen.
Med andre ord er ADR-modellen en utvidelse av den autoregressive modellen p-ordren, AR (p), som inkluderer en annen uavhengig variabel i en periode før den avhengige variabelens periode.
Eksempel
Basert på dataene fra 1995 til 2018 beregner vi de naturlige logaritmene tilskipass for hvert år, og vi går en periode tilbake for variableneskipasst og sport:
År | Skipass (€) | ln_t | ln_t-1 | Spor_t | Spor_t-1 | År | Skipass (€) | ln_t | ln_t-1 | Spor_t | Spor_t-1 |
1995 | 32 | 3,4657 | 8 | 2007 | 88 | 4,4773 | 4,3820 | 6 | 9 | ||
1996 | 44 | 3,7842 | 3,4657 | 6 | 8 | 2008 | 40 | 3,6889 | 4,4773 | 5 | 6 |
1997 | 50 | 3,9120 | 3,7842 | 6 | 6 | 2009 | 68 | 4,2195 | 3,6889 | 6 | 5 |
1998 | 55 | 4,0073 | 3,9120 | 5 | 6 | 2010 | 63 | 4,1431 | 4,2195 | 10 | 6 |
1999 | 40 | 3,6889 | 4,0073 | 5 | 5 | 2011 | 69 | 4,2341 | 4,1431 | 6 | 10 |
2000 | 32 | 3,4657 | 3,6889 | 5 | 5 | 2012 | 72 | 4,2767 | 4,2341 | 8 | 6 |
2001 | 34 | 3,5264 | 3,4657 | 8 | 5 | 2013 | 75 | 4,3175 | 4,2767 | 8 | 8 |
2002 | 60 | 4,0943 | 3,5264 | 5 | 8 | 2014 | 71 | 4,2627 | 4,3175 | 5 | 8 |
2003 | 63 | 4,1431 | 4,0943 | 6 | 5 | 2015 | 73 | 4,2905 | 4,2627 | 9 | 5 |
2004 | 64 | 4,1589 | 4,1431 | 6 | 6 | 2016 | 63 | 4,1431 | 4,2905 | 10 | 9 |
2005 | 78 | 4,3567 | 4,1589 | 5 | 6 | 2017 | 67 | 4,2047 | 4,1431 | 8 | 10 |
2006 | 80 | 4,3820 | 4,3567 | 9 | 5 | 2018 | 68 | 4,2195 | 4,2047 | 6 | 8 |
2019 | ? | ? | 4,2195 | 6 |
For å gjøre regresjonen bruker vi verdiene til ln_t som en avhengig variabel og verdieneln_t-1 Yspor_t-1 som uavhengige variabler. Verdier i rødt er utenfor regresjonen.
Vi får koeffisientene til regresjonen:
I dette tilfellet er tegnet på regressorene positivt:
- En økning på 1€ i prisenskipass i forrige sesong (t-1) beveget den seg med en økning på 0,48€i prisen påskipass for denne sesongen (t).
- En økning av en svart rullebane åpnet i forrige sesong (t-1) betyr en økning på 4,1% i prisen påskipass for denne sesongen (t).
Verdiene i parentes under koeffisientene er standardfeilene i estimatene.
Vi erstatter
Deretter,
År | Skipass (€) | Spor | År | Skipass (€) | Spor |
1995 | 32 | 8 | 2007 | 88 | 6 |
1996 | 44 | 6 | 2008 | 40 | 5 |
1997 | 50 | 6 | 2009 | 68 | 6 |
1998 | 55 | 5 | 2010 | 63 | 10 |
1999 | 40 | 5 | 2011 | 69 | 6 |
2000 | 32 | 5 | 2012 | 72 | 8 |
2001 | 34 | 8 | 2013 | 75 | 8 |
2002 | 60 | 5 | 2014 | 71 | 5 |
2003 | 63 | 6 | 2015 | 73 | 9 |
2004 | 64 | 6 | 2016 | 63 | 10 |
2005 | 78 | 5 | 2017 | 67 | 8 |
2006 | 80 | 9 | 2018 | 68 | 6 |
2019 | 63 |
ADR (p, q) vs. AR (p)
Hvilken modell er best egnet til å forutsi prisene påskipass gitt ovennevnte observasjoner, AR (1) eller ADR (1,1)? Med andre ord, innlemmer du den uavhengige variabelensport-1 i regresjonen bidrar til å bedre passe vår spådom?
Vi ser på R-kvadratet av regresjonene til modellene:
Modell AR (1): R2= 0,33
Modell ADR (1,1): R2= 0,40
R2 av modell ADR (1,1) er høyere enn R2 av AR-modellen (1). Dette betyr at å angi den uavhengige variabelensport-1 i regresjonen hjelper det å bedre passe vår spådom.