Medianen er en sentral posisjonsstatistikk som deler fordelingen i to, det vil si at den etterlater samme antall verdier på den ene siden som på den andre.
For å beregne medianen er det viktig at dataene er ordnet fra høyeste til laveste, eller omvendt fra laveste til høyeste. Det vil si at de har en ordre.
Medianen, sammen med gjennomsnittet og variansen, er en veldig illustrativ statistikk for en fordeling. I motsetning til gjennomsnittet som kan flyttes til den ene eller den andre siden, avhengig av fordelingen, er medianen alltid plassert i midten av den. Forresten, formen på fordelingen er kjent som kurtosis. Med kurtosis kan vi se hvor fordelingen beveger seg. Se kurtosis
Tiltak for sentral tendensMedianformel
Når medianen er definert, fortsetter vi å beregne den. For å gjøre dette trenger vi en formel.
Formelen vil ikke gi oss verdien av medianen, det den vil gi oss er posisjonen den er innenfor datasettet. Vi må ta hensyn til, i denne forstand, hvis det totale antallet data eller observasjoner som vi har (n) er jevnt eller merkelig. Så medianformelen er:
- Når antallet observasjoner er jevnt:
Median = (n + 1) / 2 → Gjennomsnitt av observasjonene
- Når antall observasjoner er merkelig:
Median = (n + 1) / 2 → Observasjonsverdi
Det vil si at hvis vi har 50 data arrangert helst fra minste til største, ville medianen være i observasjonsnummer 25.5. Dette er resultatet av å bruke formelen på et jevnt datasett (50 er et partall) og dele med 2. Resultatet er 25,5 siden vi deler med 50 + 1. Medianen vil være gjennomsnittet mellom observasjon 25 og 26.
I neste avsnitt vil vi se det mer detaljert, med visuelle eksempler.
Eksempel på beregning av medianen
La oss forestille oss at vi har følgende data:
2,4,12,6,8,14,16,10,18.
For det første bestiller vi dem fra minste til største med det vi vil ha følgende:
2,4,6,8,10,12,14,16,18.
Vel, medianverdien, som formelen indikerer, er en som etterlater samme mengde verdier på den ene siden som på den andre. Hvor mange observasjoner har vi? 9 observasjoner. Vi beregner posisjonen med den tilsvarende medianformelen.
Median = 9 + 1/2 = 5
Hva betyr denne 5? Den forteller oss at medianverdien finnes i observasjonen hvis posisjon er den femte.
Derfor vil medianen av disse dataene være tallet 10, siden det er i femte posisjon. I tillegg kan vi sjekke hvordan både til venstre for 5 er 4 verdier (2, 4, 6 og 8) og til høyre for 10 er det andre 4 verdier (12, 14, 16 og 18) .
Et annet eksempel på medianen
La oss forestille oss at vi har følgende tall:
1,2,4,2,5,9,8,9.
Hvis vi bestiller dem, vil vi ha følgende:
1,2,2,4,6,8,9,9.
I dette tilfellet er antall observasjoner jevnt. Derfor å ta hensyn til hensynene til antall observasjoner til og med. Formelen forteller oss følgende:
Median = 8 + 1/2 = 4,5
Selvfølgelig vil du tenke, hva er posisjon 4.5? Enten er det i posisjon 4 eller i posisjon 5, men 4,5 eksisterer ikke. Det vi skal gjøre er et gjennomsnitt av verdiene som er i posisjon 4 og 5. Tallene er 4 og 6. Gjennomsnittet mellom disse to tallene er 5 ((4 + 6) / 2).
Medianverdien ville derfor være 5. Tallet 5 (vi forestiller oss det) vil etterlate samme antall observasjoner på venstre side (1, 2, 2 og 4) som på høyre side (6, 8, 9 og 9).
Aritmetisk gjennomsnitt