Quantile - Hva er det, definisjon og konsept

Innholdsfortegnelse:

Quantile - Hva er det, definisjon og konsept
Quantile - Hva er det, definisjon og konsept
Anonim

En kvantil er det punktet som deler fordelingsfunksjonen til en tilfeldig variabel i jevne mellomrom.

Derfor er det ikke annet enn en statistisk teknikk å skille dataene fra en distribusjon. Selvfølgelig må det oppfylles at gruppene er like. Av denne grunn er det forskjellige typer kvantiler, som vi vil se senere, avhengig av antall partisjoner de lager.

De er ekstremt nyttige i mange praktiske anvendelser, i eksemplet vil vi vise en.

Kvantil beregningsskjema

Kvantiler kan beregnes fra et parametrisk og ikke-parametrisk synspunkt. La oss se på både mer detaljert og også den såkalte "kvantile funksjonen."

  • Parametrisk: De brukes i distribusjoner hvis form vi kjenner. Det vil si at fordelingen vil være normal, ensartet, eksponentiell og så videre. På denne måten antas det at den er kjent og dens hovedparametere (aritmetisk gjennomsnitt og varians) også.
  • Ikke parametrisk: Det er egnet for små prøver der det er vanskelig å vite nøyaktig form, og derfor vet vi ikke fordelingsfunksjonen. Denne metoden gir lignende verdier som den forrige når prøven øker, og bruken av begge deler er likegyldig.
  • Kvantilfunksjon: Vi står overfor en sannsynlig beregningsform. Målet er å beregne en verdi som har en viss sannsynlighet i en distribusjonsfunksjon. Vi vil ikke gå inn på matematiske spørsmål som kompliserer konseptet.

Hyppigste kvantiler

Vi skal vise hvilke som er de mest brukte kvantilene i statistikken. De fleste av dem brukes ofte for å kunne analysere detaljene distribusjonen av dataene. I tillegg er en annen av dens bruksområder å skille dataene i grupper, og være i stand til å velge den høyeste eller den laveste. I eksemplet vil vi se dette mer detaljert.

  • Kvartil: Del verdiene i fire like grupper, og det er tre kvartiler. Det er den hyppigste. Kvartil en (Q1) er den laveste data og kvartil tre (Q3) er den høyeste. På den annen side tilsvarer kvartil to (Q2) medianen (Me) som er en posisjonsstatistikk som deler fordelingen av dataene i to. Kvantilverdiene vil være 0,25 (Q1), 0,5 (Q2) og 0,75 (Q3).
  • Kvintil: I likhet med den forrige, er det sjeldnere og deler dataene i fem like store deler. Derfor er det fire kvintiler. Kvantilverdiene i dette tilfellet vil være 0,20, 0,40, 0,60, 0,80.
  • Desil: I dette tilfellet er de delt inn i ti deler, og det er derfor ni desiler. Igjen, dette er ikke for hyppig heller. Verdiene deres ville være 0,1 til 0,9.
  • Prosentiler: Vi står overfor en variant der fordelingen er delt inn i hundre like deler. Det kan være av interesse for veldig store prøver. Verdiene deres varierer fra 0,01 til 0,99.

Kvantileksempel

La oss se på et eksempel der vi har en serie med data om inntekten til innbyggerne i en bestemt kommune. Vi har beregnet de tre mest representative kvartilene og tre desiler. Vi inkluderer formlene som brukes, og tar i betraktning at for desiler bruker vi ekvivalent i prosentiler. Husk at dataene i Q2 og D5 tilsvarer medianen.

Vi kan konstatere at inntekten til individene som representerer de minst favoriserte 25% (Q1) er 2900. I forhold til desilet er inntekten til 10% (D1) av individene som mottar minst 2800. Den samme tolkningen gjøres med overordnede, men i omvendt retning. De 25% (Q3) som tjener mest, får en inntekt på 4100 og 10% på 4.800. Kvantilen reflekterer derfor relevant informasjon for å lære mer om en variabel.