Curtosis - Hva er det, definisjon og begrep

Innholdsfortegnelse:

Anonim

Kurtosen er et statistisk mål som bestemmer graden av konsentrasjon som verdiene til en variabel som er tilstede rundt den sentrale sonen i frekvensfordelingen. Det er også kjent som et målrettingstiltak.

Når vi måler en tilfeldig variabel, er resultatene med den høyeste frekvensen generelt de rundt gjennomsnittet av fordelingen. La oss forestille oss høyden på elevene i en klasse. Hvis gjennomsnittshøyden på klassen er 1,72 cm, er det mest normale at høydene til resten av studentene er rundt denne verdien (med en viss grad av variasjon, men uten å være for stor). Hvis dette skjer, anses fordelingen av den tilfeldige variabelen å være normalfordelt. Men gitt uendelig variabler som kan måles, er dette ikke alltid tilfelle.

Det er noen variabler som presenterer en høyere grad av konsentrasjon (mindre spredning) av verdiene rundt gjennomsnittet, og andre, tvert imot, presenterer en lavere grad av konsentrasjon (større spredning) av deres verdier rundt deres sentrale verdi. Derfor informerer kurtosis oss om hvor spiss (høyere konsentrasjon) eller flatt (lavere konsentrasjon) som en fordeling er.

Tiltak for sentral tendensKumulativ frekvens

Typer kurtose

Avhengig av graden av kurtose, har vi tre typer distribusjoner:

1. Leptokurtic: Det er en stor konsentrasjon av verdier rundt gjennomsnittet (g2>3)

2. Mesocúrtic: Det er en normal konsentrasjon av verdier rundt gjennomsnittet (g2=3).

3. Platicúrtica: Det er en lav konsentrasjon av verdiene rundt gjennomsnittet (g2<3).

Kurtosis målinger i henhold til dataene

Avhengig av grupperingen eller ikke av dataene, brukes en eller annen formel.

Ikke-grupperte data:

Data gruppert i frekvenstabeller:

Data gruppert i intervaller:

Eksempel på beregning av kurtose for ugrupperte data

Anta at vi vil beregne kurtosen av følgende fordeling:

8,5,9,10,12,7,2,6,8,9,10,7,7.

Vi beregner først det aritmetiske gjennomsnittet (µ), som vil være 7,69.

Deretter beregner vi standardavviket, som vil være 2,43.

Etter å ha hatt disse dataene og for enkelhets skyld i beregningen, kan det lages en tabell for å beregne delen av telleren (fjerde øyeblikk av fordelingen). For den første beregningen ville det være: (Xi-µ) 4 = (8-7.69) 4 = 0.009.

Data(Xi-µ) 4
80,0090
552,5411
92,9243
1028,3604
12344,3330
70,2297
21049,9134
68,2020
80,0090
92,9243
1028,3604
70,2297
70,2297
N = 13∑ = 1.518,27

Når vi har laget denne tabellen, må vi bare bruke formelen som tidligere ble utsatt for å ha kurtosen.

g2 = 1.518,27/13*(2,43)^4 = 3,34

I dette tilfellet siden g2 er større enn 3, vil fordelingen være leptokurtisk, og presentere en større pekepunkt enn normalfordelingen.

Overflødig kurtose

I noen håndbøker presenteres kurtose som overflødig kurtose. I dette tilfellet sammenlignes det direkte med normalfordelingen. Siden normalfordelingen har kurtosis 3, for å oppnå overskuddet, trenger vi bare å trekke 3 fra resultatet vårt.

Overflødig kurtose = g2-3 = 3,34-3 = 0,34.

Tolkningen av resultatet i dette tilfellet vil være følgende:

g2-3> 0 -> leptokurtisk fordeling.

g2-3 = 0 -> mesokortisk (eller normal) fordeling.

g2-3 platisk distribusjon.

Beskrivende statistikk