Kategorisk variabel - Hva er det, definisjon og konsept

Innholdsfortegnelse:

Kategorisk variabel - Hva er det, definisjon og konsept
Kategorisk variabel - Hva er det, definisjon og konsept
Anonim

En kategorisk variabel er en som tillater klassifisering av en serie data ved hjelp av faste verdier knyttet til en bestemt kvalitet eller kategori.

Den kategoriske variabelen, i motsetning til hoved- eller kontinuerlige variabler (som tillater numeriske beregninger), klassifiserer individer eller tilfeller. De tar normalt verdier representert av hele tall, som en eller null, men dette er bare det, representasjoner.

I eksemplet vil vi se det mer detaljert.

Forskjeller mellom kategorisk og kontinuerlig variabel

Det er noen forskjeller mellom den kategoriske variabelen og den kontinuerlige eller kardinalvariabelen som skal være kjent. La oss se det mest relevante.

  • For det første brukes den kategoriske variabelen til gruppering og den kontinuerlige variabelen for telling. Med andre ord tillater den første at kategorier dannes med en serie data. For eksempel kjønn eller antall barn. Det andre gir oss numerisk informasjon. For eksempel alder.
  • Kardinalvariabelen tillater numeriske beregninger, de andre ikke. På denne måten kan vi i den tidligere vite midlene eller avvikene, mens i de andre bare noen data, for eksempel modusen eller prosentandelen av kategorier.
  • De kategoriske er veldig nyttige for å kjenne til kvalitativ informasjon, det vil si noe av kvaliteten på dataene. De kontinuerlige gir oss kvantitative data, det vil si mengder og verdier representert av tall.

Statistiske teknikker for kategoriske variabler

Deretter la oss se de statistiske teknikkene som er mest brukt i kategoriske variabler, og sammenligne dem med kontinuerlige eller kardinalvariabler.

  • Beskrivende statistikk: I denne typen variabler er analysene vanligvis basert på blant annet søyle- og prosentdiagrammer. Kardinaler tillater anvendelse av analyseteknikker for å beregne posisjonsstatistikk som kvantiler, eller spredningsstatistikk som avvik.
  • Hypotesekontrast: I kategorien kan resultatene ekstrapoleres ved hjelp av ikke-parametriske hypotesetester. På den annen side bruker de kontinuerlige parametriske kontraster som også kan utledes.
  • Regresjonsteknikker: I dette tilfellet, for den tidligere, brukes blant annet logistisk regresjon eller lignende. For den andre typen variabler er den mest brukte teknikken lineær regresjon.

Eksempel på kategorisk variabel

For å avslutte, la oss se på et veldig vanlig eksempel innen markedsføring. La oss forestille oss at vi ønsker å selge et produkt, og vi er interessert i å vite sivilstanden.

For å gjøre dette vil vi tildele 1 til singel, 2 til gif.webpt, 3 til fraskilt, 4 til partner og 5 til andre.

La oss se bildet og kommentere det:

I den kan vi se at den høyeste prosentandelen av enkeltpersoner er single, gif.webpt og skilt, med de to andre alternativene bare 5%.

Som vi kan se, er kategoriske variabler nyttige for gruppering. Søylediagrammet lar oss bedre observere disse prosentandelene, siden det er lettere å sammenligne størrelsen på stolpene.