Multikollinearitet er det sterke lineære avhengighetsforholdet mellom mer enn to forklarende variabler i en multippel regresjon som bryter Gauss-Markov-antagelsen når den er nøyaktig.
Med andre ord er multikollinearitet den høye korrelasjonen mellom mer enn to forklarende variabler.
Vi understreker at det lineære forholdet (korrelasjon) mellom forklarende variabler må være sterkt. Det er veldig vanlig at de forklarende variablene for regresjonen er korrelert. Så det skal påpekes at dette forholdet må være sterkt, men aldri perfekt, for at det skal betraktes som et tilfelle av multikollinearitet. Det lineære forholdet ville være perfekt hvis korrelasjonskoeffisienten var 1.
Når dette sterke lineære (men ikke perfekte) forholdet kun forekommer mellom to forklarende variabler, sier vi at det er et tilfelle av kollinearitet. Det ville være multikollinearitet når det sterke lineære forholdet oppstår mellom mer enn to uavhengige variabler.
Antagelsen fra Gauss-Markov om eksakt ikke-multikollinearitet definerer at de forklarende variablene i et utvalg ikke kan være konstante. Videre skal det ikke være noen eksakte lineære sammenhenger mellom forklarende variabler (ingen eksakt multikollinearitet). Gauss-Markov tillater ikke oss nøyaktig multikollinearitet, men tilnærmer multikollinearitet.
Regresjonsanalyseapplikasjoner
Det er veldig spesielle tilfeller, vanligvis urealistiske, der regresjonsvariablene er helt uavhengige av hverandre. I disse tilfellene snakker vi om eksogeniteten til de forklarende variablene. Samfunnsvitenskapene er generelt kjent for å innlemme tilnærmet multikollinearitet i sine regresjoner.
Nøyaktig multikollinearitet
Nøyaktig multikollinearitet oppstår når mer enn to uavhengige variabler er en lineær kombinasjon av andre uavhengige variabler i regresjonen.
Problemer
Når Gauss Markov forbyr nøyaktig multikollinearitet, er det fordi vi ikke kan oppnå estimatoren for Ordinary Least Squares (OLS).
Matematisk uttrykker estimert beta sub-i i matriseform:
Så hvis det er nøyaktig multikollinearitet, fører det til at matrisen (X'X) har en determinant 0 og derfor ikke er inverterbar. Å ikke være inverterbar innebærer ikke å kunne beregne (X'X)-1 og følgelig heller ikke estimert Beta-under-i.
Omtrentlig multikollinearitet
Omtrentlig multikollinearitet oppstår når mer enn to uavhengige variabler ikke er nøyaktig (tilnærming) en lineær kombinasjon av andre uavhengige variabler i regresjonen.
Variabelen k representerer en tilfeldig variabel (uavhengig og identisk fordelt (i.i.d)). Frekvensen av observasjonene dine kan tilnærmes tilfredsstillende til en standard normalfordeling med gjennomsnitt 0 og varians 1. Siden det er en tilfeldig variabel, innebærer det at i hver observasjon i vil verdien av k være forskjellig og uavhengig av en hvilken som helst tidligere verdi.
Problemer
Matematisk uttrykk i matriseform:
Så hvis det er tilnærmet multikollinearitet, fører det til at matrisen (X'X) er omtrent 0 og bestemmelseskoeffisienten veldig nær 1.
Løsning
Multikollinearitet kan reduseres ved å eliminere regressorene til variablene med et høyt lineært forhold mellom dem.
Lineær korrelasjonskoeffisient