Variasjonskoeffisient - Hva er det, definisjon og betydning
Variasjonskoeffisienten, også kjent som Pearsons variasjonskoeffisient, er et statistisk mål som informerer oss om den relative spredningen av et datasett.
Det vil si at den informerer oss, som andre målinger av spredning, om en variabel beveger seg mye, litt, mer eller mindre enn en annen.
Formel for variasjonskoeffisient
Beregningen blir oppnådd ved å dele standardavviket med den absolutte verdien av gjennomsnittet av settet og uttrykkes vanligvis som en prosentandel for bedre forståelse.

- X: variabel som avviket skal beregnes på
- σx: Standardavvik for variabel X.
- | x̄ |: Det er gjennomsnittet av variabelen X i absolutt verdi med x̄ ≠ 0
Variasjonskoeffisienten kan sees uttrykt med bokstavene CV eller r, avhengig av manualen eller skrifttypen som brukes. Formelen er følgende:
Variasjonskoeffisienten brukes til å sammenligne datasett som tilhører forskjellige populasjoner. Hvis vi ser på formelen, ser vi at den tar hensyn til verdien av gjennomsnittet. Derfor tillater variasjonskoeffisienten oss å ha et dispersjonsmål som eliminerer mulige forvrengninger av midlene til to eller flere populasjoner.
RangEksempler på bruk av variasjonskoeffisienten i stedet for standardavviket
Her er noen eksempler på dette målet for spredning:
Sammenligning av datasett med forskjellige dimensjoner
Vi ønsker å kjøpe spredningen mellom høyden på 50 studenter i en klasse og deres vekt. For å sammenligne høyden kunne vi bruke meter og centimeter som måleenhet og kilo for vekt. Å sammenligne disse to distribusjonene ved hjelp av standardavviket vil ikke være fornuftig siden vi prøver å måle to forskjellige kvalitative variabler (et mål på lengde og en på masse).
Sammenlign sett med stor forskjell mellom middel
Tenk deg for eksempel at vi vil måle vekten av biller og flodhester. Vekten på biller måles i gram eller milligram, og vekten av flodhester måles vanligvis i tonn. Hvis vi for vår måling konverterer vekten av billene til tonn, slik at begge populasjoner er på samme skala, ville det ikke være hensiktsmessig å bruke standardavviket som et mål for spredning. Gjennomsnittlig billevekt målt i tonn ville være så liten at hvis vi brukte standardavviket, ville det knapt være noen spredning i dataene. Dette vil være en feil siden vekten mellom forskjellige billearter kan variere betydelig.
Eksempel på beregning av variasjonskoeffisienten
Tenk på en populasjon av elefanter og en annen til mus. Elefantpopulasjonen har en gjennomsnittlig vekt på 5.000 kilo og et standardavvik på 400 kilo. Muspopulasjonen har en gjennomsnittsvekt på 15 gram og et standardavvik på 5 gram. Hvis vi sammenligner spredning av begge populasjoner ved hjelp av standardavviket, kan vi tro at det er større spredning for populasjonen av elefanter enn for mus.
Når vi beregner variasjonskoeffisienten for begge populasjoner, vil vi imidlertid innse at det er akkurat det motsatte.
Elefanter: 400/5000 = 0,08
Mus: 5/15 = 0,33
Hvis vi multipliserer begge dataene med 100, har vi at variasjonskoeffisienten for elefanter bare er 8%, mens musen er 33%. Som en konsekvens av forskjellen mellom populasjonene og gjennomsnittlig vekt, ser vi at populasjonen med størst spredning ikke er den med størst standardavvik.
KonfidensintervallLineær korrelasjonskoeffisient