Variancia - Hva er det, definisjon og betydning

Innholdsfortegnelse:

Anonim

Variasjon er et mål for spredning som representerer variasjonen i en dataserie i forhold til gjennomsnittet. Formelt blir det beregnet som summen av de kvadratiske restene delt på summen av observasjoner.

Det kan også beregnes som standardavviket i kvadrat. Forøvrig forstår vi restverdien som forskjellen mellom verdien til en variabel om gangen og gjennomsnittsverdien til hele variabelen.

Se alle målinger av spredning

Før vi ser på variansformelen, må vi si at avviket i statistikk er veldig viktig. Siden selv om det er et enkelt mål, kan det gi mye informasjon om en bestemt variabel.

Formel for å beregne avviket

Måleenheten til variansen vil alltid være måleenheten som tilsvarer dataene, men kvadratert. Avviket er alltid større enn eller lik null. Ettersom restene er kvadrert, er det matematisk umulig for avviket å komme ut negativt. Og på den måten kan det ikke være mindre enn null.

Hvor

  • X: variabel som avviket skal beregnes på
  • xJeg: observasjonsnummer i for variabel X. Jeg kan ta verdier mellom 1 og n.
  • n: antall observasjoner.
  • : Det er gjennomsnittet av variabelen X.

Eller hva er det samme:

Hvorfor er restene i kvadrat?

Årsaken til at restene er kvadrert er enkel. Hvis de ikke ble kvadrert, ville summen av restene være null. Det er en avfallsegenskap. Så for å unngå dette, som med standardavviket, er de kvadratiske. Resultatet er måleenheten der dataene blir målt, men i kvadrat.

For eksempel, hvis vi hadde data om lønningene til et sett med mennesker i euro, ville dataene som gir avviket være i kvadrat euro. For at tolkningen skal være fornuftig, beregner vi standardavviket og overfører dataene til euro.

  1. Avvik -> (2-3) = -1
  2. Avvik -> (4-3) = 1
  3. Avvik -> (2-3) = -1
  4. Avvik -> (4-3) = 1
  5. Avvik -> (2-3) = -1
  6. Avvik -> (4-3) = 1

Hvis vi legger til alle avvikene, er resultatet null.

Rang

Hva er forskjellen mellom variansen og standardavviket?

Et spørsmål som kunne stilles, og med god grunn, ville være forskjellen mellom avvik og standardavvik. I virkeligheten kommer de til å måle det samme. Avviket er standardavviket i kvadrat. Eller omvendt er standardavviket kvadratroten til variansen.

Standardavviket er laget for å kunne arbeide i de første måleenhetene. Selvfølgelig, som det er normalt, kan man lure på, hva nytter det å ha varians som et begrep? Vel, selv om tolkningen av verdien den returnerer ikke gir oss mye informasjon, er beregningen nødvendig for å oppnå verdien av andre parametere.

For å beregne kovariansen trenger vi variansen og ikke standardavviket, for å beregne noen økonometriske matriser brukes variansen og ikke standardavviket. Det er et spørsmål om komfort når du arbeider med dataene i henhold til hvilke beregninger.

Eksempel på variansberegning

Vi skal mynte en rekke data om lønn. Vi har fem personer, hver med forskjellig lønn:

Juan: 1500 euro

Pepe: 1200 euro

José: 1700 euro

Miguel: 1.300 euro

Mateo: 1800 euro

Gjennomsnittlig lønn, som vi trenger for beregningen, er ((1500 + 1200 + 1700 + 1300 + 1800) / 5) 1500 euro.

Siden variansformelen i den nedbrutte formen er formulert som følger:

Vi vil oppnå at det må beregnes slik at:

Resultatet er 52 000 euro i kvadrat. Det er viktig å huske at når vi beregner variansen, har vi måleenhetene i kvadrat. For å konvertere det til euro, må vi i dette tilfellet utføre standardavviket. Det omtrentlige resultatet ville være 228 euro. Dette betyr at forskjellen mellom lønnene til de forskjellige menneskene i gjennomsnitt vil være 228 euro.