Analyse av varians - Hva er det, definisjon og begrep

Variansanalyse, eller ANOVA (variansanalyse), er multivariate avhengighetsanalyseteknikker som brukes til å bestemme om det er signifikante forskjeller mellom midlene til tre eller flere befolkningsgrupper.

Derfor vil vi med denne analysen finne ut om det er forskjeller mellom visse grupper når vi endrer en eller flere egenskaper. For å finne ut av det, bruker vi verdien av gjennomsnittet av dataene.

Bruken er veldig hyppig innen felt som økonomi eller medisin.

Tidligere forutsetninger om variansanalysen

Det er en rekke forutsetninger for å utføre ANOVA som skal være kjent. Disse er avgjørende for at resultatene skal være tilstrekkelige.

  • For det første må befolkningen følge en normalfordeling. Derfor har vi å gjøre med en type parametrisk kontrast, siden populasjonsparametrene til gjennomsnittet og standardavviket er kjent.
  • Videre må prøvene brukes uavhengig av hverandre. Dette betyr at en modifikasjon i en av dem ikke trenger å påvirke verdien til de andre.
  • På den annen side må avvikene til populasjonene som studeres være like. Dette kalles homoscedasticity.

Klassifisering av analysen av variansmodeller

For analysen av variansmodeller kan de tre klassifikasjonene vist nedenfor brukes:

  • Fixed Effects Model: Befolkningen er normal og skiller seg bare ut i verdien av deres respektive midler.
  • Tilfeldig effektmodell: I dette tilfellet har dataene et hierarki, og befolkningsforskjellene avhenger av det.
  • Mixed effects-modell: Vi står overfor en modell som er en blanding av de to foregående.

ANOVA-eksempel: viktige konsepter

Det er matematiske ligninger av litt kompleksitet for å utføre ANOVA. Imidlertid velger vi på Economy-Wiki.com den enkle økonomien, og derfor, og ved å dra nytte av teknologi, skal vi vise hvordan det kan gjøres i et regneark.

La oss forestille oss at vi vil vite om det er betydelige forskjeller mellom Economy-Wiki.com-lesere, basert på deres tilknytning til økonomi.

Advarsel: Dataene vi skal bruke er fiktive.

Vi må gå til Data, Data analyse og vi vil velge variansanalysen til en faktor.

Rangeringen vil være matrisen til de tre gruppene. Det kan være mer interessant å inkludere overskriftene etterpå og gi ønsket formatering. I vårt tilfelle, med logoen og fargen blå.

Vi ser at det er noen begreper som grader av frihet og sannsynlighet eller betydning. Den første beregnes automatisk og er antall grupper minus en. Det andre forteller oss om forskjellene er betydelige eller ikke.

Vanligvis starter du fra et akseptert nivå av tillit. I økonomi er det vanligvis 95% (0,95), som er relatert til en betydning på 0,05 (1-0,095). Således, hvis denne sannsynligheten eller p-verdien er under akseptert betydning, er forskjellene signifikante.

I dette tilfellet ser det ut til at graden ikke påvirker antall lesere (betydning> 0,05). Derfor ser avviksanalysen ut til å indikere at Economy-Wiki.com interesserer alle, ikke bare spesialiserte lesere. Selvfølgelig er de fiktive data eller ikke?