Bayesian-informasjonskriteriet eller Schwarz-kriteriet er en metode som fokuserer på summen av kvadratene til restene for å finne antall forsinkede perioder s som minimerer denne modellen.
Med andre ord, vi ønsker å finne minimum antall forsinkede perioder som vi inkluderer i autoregresjonen for å hjelpe oss med prediksjon av den avhengige variabelen.
På denne måten vil vi ha kontroll over antall forsinkede perioder s at vi inkluderer i regresjonen. Når vi overskrider dette optimale nivået, slutter Schwarz-modellen å synke, og derfor vil vi ha nådd minimumet. Det vil si at vi vil ha nådd antall forsinkede perioder s som minimerer Schwarz-modellen.
Det kalles også Bayes Information Criterion (BIC).
Anbefalte artikler: autoregresjon, sum av kvadrater av rester (SCE).
Bayesian Information Criterion Formula
Selv om det ved første øyekast virker som en komplisert formel, vil vi gå gjennom deler for å forstå det. Først og fremst må vi på en generell måte:
- Logaritmene i begge faktorene med formelen representerer den marginale effekten av å inkludere en forsinket periode s mer i selvregresjon.
- N er det totale antallet observasjoner.
- Vi kan dele formelen i to deler: venstre del og høyre del.
Delen til venstre:
Representerer summen av kvadratene til restene (SCE) av autoregresjonen avs forsinkede perioder, delt på totalt antall observasjoner (N).
For å estimere koeffisientene bruker vi vanlige minste kvadrater (OLS). Så når vi inkluderer nye forsinkede perioder, kan SCE (p) bare opprettholdes eller reduseres.
Deretter forårsaker økningen av en forsinket periode i autoregresjonen:
- SCE (p): avtar eller forblir konstant.
- Bestemmelseskoeffisient: øker.
- TOTAL EFFEKT: en økning i en forsinket periode fører til en reduksjon i den venstre delen av formelen.
Nå er den rette delen:
(p + 1) representerer det totale antallet koeffisienter i autoregresjonen, det vil si regressorene med sine forsinkede perioder (s) og skjæringspunktet (1).
Deretter forårsaker økningen av en forsinket periode i autoregresjonen:
- (p + 1): øker fordi vi innlemmer en forsinket periode.
- TOTAL EFFEKT: en økning i en forsinket periode fører til en økning i høyre del av formelen.
Praktisk eksempel
Vi antar at vi ønsker å komme med en spådom om prisene påskipass for neste sesong 2020 med et 5-års utvalg, men vi vet ikke hvor mange forsinkelsesperioder vi skal bruke: AR (2) eller AR (3)?
- Vi laster ned dataene og beregner de naturlige logaritmene til prisene på skipass.
1. Vi estimerer koeffisientene ved bruk av OLS og oppnår:
Summen av kvadrater av rester (SCE) for AR (2) = 0,011753112
Bestemmelseskoeffisient for AR (2) = 0,085
2. Vi legger til 1 mer forsinket periode for å se hvordan SCE endres:
Summen av kvadrater av rester for AR (3) = 0,006805295
Bestemmelseskoeffisient for AR (3) = 0,47
Vi kan se at når vi legger til en forsinket periode i autoregresjonen, øker bestemmelseskoeffisienten og SCE avtar i dette tilfellet.
- Vi beregner det Bayesiske informasjonskriteriet:
Jo mindre BIC-modellen er, desto mer foretrukket er modellen. Deretter ville AR (3) være den foretrukne modellen med hensyn til AR (2) gitt at dens bestemmelseskoeffisient er høyere, SCE er lavere og Schwarz-modellen eller Bayesian-informasjonskriteriet er også lavere.