Beskrivende statistikk - Hva det er, definisjon og konsept

Innholdsfortegnelse:

Anonim

Beskrivende statistikk er et fag som er ansvarlig for å samle, lagre, bestille, lage tabeller eller grafer og beregne grunnleggende parametere på datasettet.

Beskrivende statistikk er, sammen med statistisk inferens eller inferensiell statistikk, en av de to store grenene av statistikk. Dets eget navn indikerer det, det prøver å beskrive noe. Men ikke beskriv det på noen måte, men på en kvantitativ måte. Tenk på vekten til en boks med grønnsaker, høyden på en person eller hvor mye penger en bedrift tjener. Vi kan si mange ting om disse variablene. For eksempel kan vi indikere at denne eller den boksen tomater veier mye eller veier mindre enn andre. Fortsetter vi med et annet eksempel, kan vi si at inntektene til et selskap varierer mye over tid eller at en person har en gjennomsnittlig høyde.

For å diktere ovenstående utsagn, om mye, lite, høyt, lavt, veldig variabelt eller lite variabelt, trenger vi målevariabler. Det vil si at vi må kvantifisere dem, tilby et tall. Med dette i tankene kan vi bruke gram eller kilo som måleenhet for å finne vekten av så mange bokser med tomater som vi vurderer. Når vi veier tretti bokser, vil vi vite hvilke som veier mer, hvilke som veier mindre, hvor mye som gjentas mest, eller om det er mye forskjell mellom vekten til de forskjellige boksene.

Beskrivende statistikk ble født med denne ideen, for å samle inn data, lagre den, lage tabeller eller til og med grafer som gir oss informasjon om et bestemt emne. I tillegg tilbyr de oss tiltak som oppsummerer informasjonen til en stor mengde data.

Typer av statistiske variabler

Innen beskrivende statistikk kan vi beskrive dataene kvalitativt eller kvantitativt.

  • Kvalitativ variabel: Det refererer til en kvalitet. Eksempler: en persons øyenfarge eller hårfarge.
  • Kvantitativ variabel: Det refererer til et kvantitativt mål. Eksempler: en persons høyde i centimeter eller en persons vekt i kg.

Dermed kan visse parametere beregnes på disse variablene. Spesielt på kvantitative variabler. Siden, for eksempel, hva er gjennomsnittsverdien for øyenfarge? Hvis det er fem personer med blå øyenfarge og fem med grønne øyenfarge, vil gjennomsnittet ikke være at de har en gjennomsnittlig blågrønn øyenfarge. Derfor ville det i så fall ikke være mulig å beregne noen av parametrene som vi vil se nedenfor.

Statistisk variabel

Grunnleggende statistiske parametere

For å oppsummere informasjonen ble det utviklet forskjellige formler som ga mål av en bestemt type. Dermed er det de som gir oss informasjon om sentrum, andre om spredning eller variasjon og andre om posisjonen til en verdi.

  • Tiltak for sentral tendens: Så kalt fordi de gir informasjon om datasenteret. For eksempel er gjennomsnittet et mål på trend eller sentral posisjon siden gjennomsnittet gir oss en sentrert verdi av datasettet. Hvor kan vi si at midtpunktet ligger? I sentrum, i midten omtrent. Et annet eksempel på et mål på sentral tendens er medianen.
  • Målinger av spredning: De er også kjent som målinger av variabilitet. Standardavviket er for eksempel et mål på variabilitet siden det forteller oss om verdiene til et datasett er veldig forskjellige eller ikke. To flere eksempler på målinger av spredning kan være variansen og det statistiske området.
  • Posisjonsmålinger: De er ikke de mest kjente, men de brukes ofte. Et eksempel på dette finnes i persentiler eller desiler. Når en spesifikk data er i den 90. persentilen, betyr det at 90% av dataene er under disse dataene. Det er andre posisjonsmål som kvartiler eller noen varianter som første kvartil.

Frekvensfordeling

Det er også interessant å se hvordan frekvensene fordeles. For dette er det visse begreper vi må vite:

  • Absolutt frekvens: Det er det totale antall ganger en observasjon gjentas. Observasjoner kan noen ganger presenteres med intervaller.
  • Relativ frekvens: Det er tallet i prosent at en observasjon eller et sett av dem gjentas.
  • Akkumulert frekvens: Den kan akkumuleres relativ eller akkumulert absolutt. Indikerer mengden akkumulert opp til en viss observasjon.

Tabeller og grafer i beskrivende statistikk

Selv om tabeller og grafer ikke er unike for beskrivende statistikk, preger de den. I rapporter, studier og forskning er bruken av grafer veldig vanlig. De hjelper oss med å vise informasjonen på en enklere og mer begrenset måte.

Selvfølgelig er det enorme mengder typer innenfor tabellene og grafene. Her er noen eksempler på ofte brukte grafer og tabeller.

  • Histogram.
  • Stanggrafikk.
  • Kake diagram.
  • Sannsynlighetstabeller.
  • To-dimensjonale tabeller.
  • Rutediagram.

Beskrivende statistiske eksempler

Et eksempel på beskrivende statistikk vil være når vi ønsker å beregne gjennomsnittlige mål per kamp for en fotballspiller. Det er beskrivende statistikk, siden vi prøver å beskrive en variabel (antall mål). I dette tilfellet, ved å beregne en beregning.

Så å si at Ronaldo scoret 1,05 mål per kamp i løpet av de siste 30 kampene, er en skikkelig beskrivende statistikkuttrykk.

Vi kan for eksempel også si at 30% av klassekameratene til Juan har blå øyne, 60% brune og de resterende 10% svarte. Det ville være en kvalitativ variabel (øyenfarge), men vi beskriver hvor ofte den vises.