Kurtosen er et statistisk mål som bestemmer graden av konsentrasjon som verdiene til en variabel som er tilstede rundt den sentrale sonen i frekvensfordelingen. Det er også kjent som et målrettingstiltak.
Når vi måler en tilfeldig variabel, er resultatene med den høyeste frekvensen generelt de rundt gjennomsnittet av fordelingen. La oss forestille oss høyden på elevene i en klasse. Hvis gjennomsnittshøyden på klassen er 1,72 cm, er det mest normale at høydene til resten av studentene er rundt denne verdien (med en viss grad av variasjon, men uten å være for stor). Hvis dette skjer, anses fordelingen av den tilfeldige variabelen å være normalfordelt. Men gitt uendelig variabler som kan måles, er dette ikke alltid tilfelle.
Det er noen variabler som presenterer en høyere grad av konsentrasjon (mindre spredning) av verdiene rundt gjennomsnittet, og andre, tvert imot, presenterer en lavere grad av konsentrasjon (større spredning) av deres verdier rundt deres sentrale verdi. Derfor informerer kurtosis oss om hvor spiss (høyere konsentrasjon) eller flatt (lavere konsentrasjon) som en fordeling er.
Tiltak for sentral tendensKumulativ frekvensTyper kurtose
Avhengig av graden av kurtose, har vi tre typer distribusjoner:
1. Leptokurtic: Det er en stor konsentrasjon av verdier rundt gjennomsnittet (g2>3)
2. Mesocúrtic: Det er en normal konsentrasjon av verdier rundt gjennomsnittet (g2=3).
3. Platicúrtica: Det er en lav konsentrasjon av verdiene rundt gjennomsnittet (g2<3).
Kurtosis målinger i henhold til dataene
Avhengig av grupperingen eller ikke av dataene, brukes en eller annen formel.
Ikke-grupperte data:
Data gruppert i frekvenstabeller:
Data gruppert i intervaller:
Eksempel på beregning av kurtose for ugrupperte data
Anta at vi vil beregne kurtosen av følgende fordeling:
8,5,9,10,12,7,2,6,8,9,10,7,7.
Vi beregner først det aritmetiske gjennomsnittet (µ), som vil være 7,69.
Deretter beregner vi standardavviket, som vil være 2,43.
Etter å ha hatt disse dataene og for enkelhets skyld i beregningen, kan det lages en tabell for å beregne delen av telleren (fjerde øyeblikk av fordelingen). For den første beregningen ville det være: (Xi-µ) 4 = (8-7.69) 4 = 0.009.
Data | (Xi-µ) 4 |
---|---|
8 | 0,0090 |
5 | 52,5411 |
9 | 2,9243 |
10 | 28,3604 |
12 | 344,3330 |
7 | 0,2297 |
2 | 1049,9134 |
6 | 8,2020 |
8 | 0,0090 |
9 | 2,9243 |
10 | 28,3604 |
7 | 0,2297 |
7 | 0,2297 |
N = 13 | ∑ = 1.518,27 |
Når vi har laget denne tabellen, må vi bare bruke formelen som tidligere ble utsatt for å ha kurtosen.
g2 = 1.518,27/13*(2,43)^4 = 3,34
I dette tilfellet siden g2 er større enn 3, vil fordelingen være leptokurtisk, og presentere en større pekepunkt enn normalfordelingen.
Overflødig kurtose
I noen håndbøker presenteres kurtose som overflødig kurtose. I dette tilfellet sammenlignes det direkte med normalfordelingen. Siden normalfordelingen har kurtosis 3, for å oppnå overskuddet, trenger vi bare å trekke 3 fra resultatet vårt.
Overflødig kurtose = g2-3 = 3,34-3 = 0,34.
Tolkningen av resultatet i dette tilfellet vil være følgende:
g2-3> 0 -> leptokurtisk fordeling.
g2-3 = 0 -> mesokortisk (eller normal) fordeling.
g2-3 platisk distribusjon.
Beskrivende statistikk