Kvartilavvik - Hva det er, definisjon og konsept

Kvartilavvik er et statistisk mål på spredning som returnerer den sentrale verdien av interkvartilområdet og brukes i skjev datasett.

Med andre ord er kvartilavviket å beregne medianen til interkvartilområdet (IQR) og brukes i datasett med ganske mange ekstreme verdier.

Forkortelsen for kvartilavvik er DQ.

Interkvartil rekkevidde

Interkvartilområdet er et mål for spredning av et datasett som vanligvis brukes i kartplottet. Interkvartilområdet er med andre ord forskjellen mellom den nest siste og de første kvartilene i en distribusjon som brukes i boksplottet.

IQR = Q3 - Q1

Fordelen med å bruke interkvartilområdet er at kvartilavviket (DQ) kan beregnes, noe som er et veldig tilstrekkelig mål for spredning når vi har partiske datasett.

Formel for avvik for kvartil

Kvartilavviket beregnes som divisjonen av interkvartilområdet med 2.

DQ = (Q3 - Q1) / 2 = RIC / 2

Siden vi bare vurderer spredningen mellom tredje og første kvartil, ignorerer vi alle data utenfor det området. Og derfor er alle verdier nær å være ekstreme. Så hvis vi deler interkvartilområdet med to, vil vi få medianverdien av dispersjonen.

Eksempel på kvartilavvik

Vi antar at vi ønsker å beregne interkvartilområdet og kvartilavviket til antall syklister som passerer huset vårt i løpet av året.

  1. Først teller vi syklistene og samler informasjonen i en tabell.
  1. For det andre beregner vi første og tredje kvartil for å oppnå interkvartilområdet.

Q3 = 550

Q1 = 200

IQR = Q3 - Q1 = 550-200 = 350

  1. For det tredje beregner vi kvartildispersjonen ved ganske enkelt å dele interkvartilområdet med to.

DQ = (Q3 - Q1) / 2 = IQR / 2 = 350/2 = 175

Kvartilspredningen for dette datasettet er 175. Dette tallet er den sentrale verdien av interkvartilområdet.

Det er viktig å merke seg at dataene for juli måned er ekstreme data, siden de er flere ganger høyere enn alle andre data. Så vi kan si at dette datasettet er partisk mot den måneden. Takket være "uvitenhet" om kvartilens spredning mot ekstreme data, er resultatet av dette tiltaket veldig likt hvis bare 600 syklister sirkulerte i juli. Hvis det bare var 600 syklister i juli, ville kvartilspredningen være 162,5, veldig nær 175 med tanke på at antall syklister den måneden er 10 ganger mindre.

Populære Innlegg