Utelatelsen av en relevant variabel er ikke inkluderingen av en viktig forklaringsvariabel i en regresjon. Gitt Gauss-Markov-antagelsene, ville denne utelatelsen forårsake skjevhet og inkonsekvens i våre estimater.
Med andre ord, utelatelsen av en relevant variabel skjer når vi innlemmer den i feiluttrykket u fordi vi ikke tar den i betraktning. Dette vil føre til at det eksisterer en sammenheng mellom den avhengige variabelen og feiluttrykket u.
Matematisk antar vi at:
Cov (x, u) = 0
Hvis vi tar med en relevant variabel i feiluttrykket eller, deretter:
Cov (x, u) ≠ 0
Gitt Gauss-Markov-antagelsene, er denne sammenhengen:
(ρ (x, u) ≠ 0)
Det ville ikke oppfylle det:
E (u | x) = E (u) = 0
Det vil si at forventningen om feilene som er betinget av de forklarende, er lik forventningen om feilen, og at den også er null. Dette er antagelsene om upartiskhet (streng eksogenitet + null gjennomsnitt)
I tilfeller der den aktuelle variabelen utelates, er OLS-estimatoren partisk og blir inkonsekvent. Så det bryter med to av estimatoregenskapene og fører til at estimatet vårt er feil.
Teoretisk eksempel
Vi antar at vi ønsker å studere antall sesongløpere (t) under hensyntagen til flere faktorer: prisen på skipassene (skipassene) og antall åpne bakker (bakkene) og kvaliteten på snøen (snøen).
Modell 0
Vi antar at de forklarende variablene (skipass, bakker og snø) er relevante variabler for modell 0 fordi de tilhører populasjonsmodellen. Med andre ord har forklaringsvariablene til vår modell 0 en delvis effekt på de avhengige variable skiløpere i populasjonsmodellen. Så vil både i populasjons- og utvalgsmodellene (modell 0) ha andre koeffisienter enn null.
Tolkning
En økning i kvaliteten på snøen (i snøen) og i antall åpne løp (spor) fører til en økning i estimatene av β2 og β3. Følgelig gjenspeiles dette i antall skiløpere (skiløpere).
En prosentvis økning i skipassprisene medfører en reduksjon i β1/ 100 i antall løpere (skiløpere)
Prosess
Vi behandler snøvariabelen som en utelatt variabel fra modellen. Deretter:
Modell 1
Vi skiller feilbegrepet u fra modell 0 og feiluttrykket v fra modell 1 fordi den ene ikke inkluderer den aktuelle variabelen snø, og den andre gjør det.
I modell 1 har vi utelatt en relevant variabel fra modellen og introdusert den i feiluttrykket u. Dette betyr at:
- Cov (snø, v) ≠ 0 → ρ (snø, v) ≠ 0
- E (v | snø) ≠ 0
Hvis vi utelater relevant variabel snø i vår modell 1, vil vi føre til at OLS-estimatoren presenterer skjevhet og inkonsekvens. Så vårt estimat på antall sesongløpere vil være feil. Skianlegget kan være i alvorlige økonomiske problemer hvis du tar vårt estimat av modell 1 i betraktning.