Dummyvariabel - Hva er det, definisjon og konsept

En dummyvariabel er en variabel som brukes til å forklare kvalitative verdier i en regresjonsmodell.

Regresjonsmodeller prøver å forklare en variabel i forhold til andre. For eksempel en persons lønn basert på alder, utdannelse og erfaring. Disse variablene kan kvantifiseres. En persons alder, utdannelse og erfaring kan kvantifiseres i antall år. Men hva skjer når vi har variabler som ikke kan tallfestes? For eksempel hårfarge, land der du bor eller kjønn. Løsningen på dette problemet er i dummyvariablene. De er variabler som vanligvis tar binære verdier. Det vil si verdi null eller en.

For eksempel er det variable kjønnet, vi har sagt, en kvalitativ variabel. For å inkludere den i en regresjonsmodell, må du opprette en dummyvariabel. Vi vil kalle variabelen "kvinne" slik at:

Kvinne = 1 (hvis individet er kvinne)

Kvinne = 0 (hvis individet ikke er kvinne, det vil si at han er en mann)

I dette tilfellet betraktes "mann" som en referansekategori eller basegruppe.

Det er to typer dummyvariabler. På den ene siden er det additivdummyvariablene, og på den andre siden er det multiplikative dummyvariablene.

Regresjonsanalyse

Additiv dummyvariabel

En additiv dummyvariabel samler en fast endring. Denne endringen påvirker bare ligningens konstante periode. For eksempel en modell som tar sikte på å forklare lønn basert på kjønn og utdannelsesår. Vi kan sette ligningen som referanse til menn (andre ligning) eller tar som en referanse til kvinner (første ligning):

Den grafiske representasjonen av ligningene vil være: I tilfelle menn har høyere lønn og tar en additiv dummyvariabel, vil modellen bli representert som forrige bilde.

I ditt tilfelle, hvis kvinner hadde høyere lønn enn menn, og som tok en additiv dummyvariabel, ville modellen bli representert grafisk som forrige bilde.

Den kvantitative forskjellen mellom den blå linjen (menn) og den oransje linjen (kvinner) vil være lik verdien av variabelen «Kvinner"eller"Menn»I henhold til valgt modell. I dette tilfellet, av additivdummyvariablene, avhenger ikke lønnsforskjellen av studienivået. Med andre ord avhenger lønnsforskjellen utelukkende og kjønn.

Multiplikativ dummyvariabel

En multiplikativ dummyvariabel fanger en endring i helling av ligningene for menn og kvinner. Fortsetter med forrige eksempel har vi:

Grafisk sett vil en mulig representasjon være:

I dette tilfellet forteller modellen oss to ting. Først og fremst er kvinnelønnene lavere enn menns. Og for det andre at et ekstra utdannelsesår lønner seg bedre for menn enn kvinner. Vi vet dette fordi hellingen til den blå linjen (menn) er større enn hellingen til den oransje linjen (kvinner).

Hvis et ekstra utdannelsesår ble betalt bedre til kvinner, ville hellingen til den oransje linjen (kvinner) være større. Og den blå linjen (menn) ville være under.

Statistisk variabel