Box Plot - Hva er det, definisjon og konsept

Innholdsfortegnelse:

Box Plot - Hva er det, definisjon og konsept
Box Plot - Hva er det, definisjon og konsept
Anonim

En boxplot, fra engelsk, boxplot, er en representasjon av en kvantitativ eller kategorisk variabel med det formål å raskt identifisere kvartilene til datasettet.

Med andre ord er en boksplott en graf som representerer en kvantitativ eller kvalitativ variabel gjennom kvartilene.

I statistikk er det et nyttig verktøy for å representere både diskrete og kontinuerlige datasett.

Det er viktig å huske på at de kvalitative variablene eller som er ment å representere en ordre eller en kategori alltid må være knyttet til en numerisk indeks større enn 0 slik at de kan vises på grafen og den tilsvarende statistikken kan beregnes.

Boksplott og histogram

En boksplott er ikke noe annet enn et histogram sett ovenfra, og på samme måte er et histogram et kartplott sett fra siden. Et eksempel kan sees nedenfor.

Den første egenskapen som begge diagrammer deler er minimum og maksimum for datasettet. Endestengene etter bindestrekene indikerer minimum (nedre stolpe) og maksimum (øvre bjelke). Outliers vil bli representert utenfor området maksimum og minimum. Det vil si utover stolpene etter bindestrekene. Vi kan også finne horisontale kassetomter.

Med et øyeblikk kan du se at det meste av dataene er sentrert på observasjonene nær minimumet i begge grafene. Dette indikeres av boksplottet der boksen er nærmere minimum enn maksimum. Hvis vi ser på histogrammet, vil vi se at de hyppigste observasjonene er observasjonene som er nær minimum og langt fra maksimum.

Informasjon om kartplott

Informasjonen gitt av kartplottet er som følger:

  1. Bunnen av boksen er den første kvartilen (Q1).
  2. Linjen midt i boksen er median eller andre kvartil (Q2).
  3. Toppen av boksen er den tredje kvartilen (Q3).
  4. Interkvartilområdet eller IQR vil være høyden på boksen, det vil si forskjellen mellom Q3 og Q1.

Box plot-nøkkel

Denne grafiske representasjonen kalles en boksplott fordi den ser ut som en boks. Derfor, for å huske denne grafen, trenger vi bare å tenke på en firkantet gjenstand eller en boks.

For lesere som er kjent med prisen på finansielle eiendeler, vil de se mer likhet med et lys. Stearinlysene du ser i sitatet er kartplotter justert til det valgte tidsvinduet.

Fordeler og ulemper ved kassetomten

Blant fordelene og ulempene med dette diagrammet finner vi følgende:

Fordel

  • Globalisert visjon om den absolutte frekvensen til en kvantitativ eller kvalitativ variabel.
  • Kunnskap om minimum, maksimum og kvartiler av datasettet uten å måtte beregne dem.
  • Anerkjennelse av ekstreme verdier raskere enn med et histogram fordi ekstreme verdier er angitt med sirkler utenfor maksimum og minimum.

Ulemper

  • Hvis datasettet er lite, vil det være vanskeligere å forstå det å lage et kartplott for å uttrykke disse dataene.

Eksempel på bokseplott

Vi antar at vi ønsker å representere antall syklister som passerer huset vårt i løpet av et år. Først teller vi syklistene og samler informasjonen i en tabell.

Gjennom noen programmer som R eller Excel kan vi generere grafen vist nedenfor.

Takket være å representere antall syklister gjennom ruteplottet, kan vi raskt intuitere hvor medianen er, de andre kvartilene, maksimum og minimum. I dette tilfellet har vi ikke atypiske data, siden det er ingenting utenfor maksimum og minimum.

Anvendelsen av denne typen graf er veldig vanlig gitt sin enkelhet og nytte på mange områder utover økonomi og økonomi.