Enkel autokorrelasjonsfunksjon - Eksempel i R

Innholdsfortegnelse:

Anonim

Med andre ord, den enkle autokorrelasjonsfunksjonen (FAS), eller fra engelsk, Autokorrelasjonsfunksjon, Det er en matematisk funksjon som hjelper oss å vite hvor avhengige dataene i en gitt periode har av de samme dataene fra k tidligere perioder.

Vi genererer en årlig tidsserie X som følger en normalfordeling pluss en treghet. Vi kan også bruke reelle data.

Metodikk

Programmer er avgjørende for å jobbe med autokorrelasjonsanalysen. Programmer som Python kan brukes, men for statistisk analyse og datahåndtering anbefaler vi R, eller den forbedrede versjonen, R Studio. Her vil vi jobbe med R.

Beregning

Og hvordan skriver vi FAS-formelen i R-kode?

Både R og Python har biblioteker der formler er knyttet til et navn. Så er det nok at vi har installert biblioteket som inneholder formelen vi vil bruke og kaller det i skriptet.

I spørsmålet om R må vi skrive:

Funksjonen acf det er inne i biblioteket statistikk.

X -> Tidsserier som vi bruker som et eksempel for å beregne FAS.

acf (X, ylim = c (-1,1)) -> Enkel autokorrelasjonsfunksjon på X med grenser på den vertikale aksen mellom -1 og 1, som er verdiene som autokorrelasjonskoeffisienten kan ta.

Bekreftelse

Dette trinnet er ikke nødvendig hvis vi har brukt den forrige koden siden den beregner selve konfidensbåndene.

For å bestemme om de beregnede autokorrelasjonskoeffisientene er statistisk signifikante, må vi etablere konfidensbånd med de kritiske verdiene. På denne måten, gitt en prosentandel av betydning, kan vi med statistisk sikkerhet si om det er tilstedeværelse av autokorrelasjon i dataene.

På samme måte som korrelasjonskoeffisienten antar autokorrelasjonskoeffisienten også normalitet, og derfor vil vi beregne konfidensintervallet som følger:

Vi definerer hypotesetesting som:

Ved 95% konfidens med et signifikansnivå på 5%, finner vi den berømte 1,96 i normale tabeller. Kritisk verdi er gitt av:

Der variansen til koeffisientene er gitt ved tilnærmingen:

Selv om vi gir formelen, anbefaler vi at du bruker statistiske programmer for større presisjon og hastighet.

Utfall

Alle linjer som slutter utenfor konfidensbåndet betyr at tidsserien viser autokorrelasjon i den angitte perioden.

Så basert på grafen ser vi at det er tilstedeværelse av autokorrelasjon i denne tidsserien i periodene linjen stikker ut fra det diskontinuerlige båndet.

Den første linjen som er ved 0 og branner mot 1 kan ignoreres siden t må være strengt større enn 0, og i dette tilfellet er det ikke. Det gir ikke mye mening å måtte gjøre alle de forrige trinnene for å vite autokorrelasjonen av nå med nå fordi vi allerede vet det: Korrelasjonen til en variabel med seg selv er 1, så vi har allerede svaret.