Statistisk tegn - Hva det er, definisjon og konsept

Innholdsfortegnelse:

Statistisk tegn - Hva det er, definisjon og konsept
Statistisk tegn - Hva det er, definisjon og konsept
Anonim

Et statistisk utvalg er en delmengde av data som tilhører en datapopulasjon. Statistisk sett må den bestå av et visst antall observasjoner som tilstrekkelig representerer de totale dataene.

Statistikk, som en gren av matematikk, er ansvarlig for å samle inn data, bestille og analysere dem. Med andre ord, når vi vil studere et bestemt fenomen, går vi til statistikk. Et godt eksempel på et fenomen studert av statistikk er gjennomsnittslønnen til innbyggerne i et land

I denne forstand, av hensyn til tid og kostnad, kan vi ikke samle inn alle dataene. Denne totalen av data er det som er kjent som en datapopulasjon eller ganske enkelt en populasjon.

Hvorfor jobber du med statistiske prøver?

For å forklare hvorfor et statistisk utvalg brukes i stedet for den totale befolkningen, vil vi ty til eksemplet som er reist ovenfor.

Anta at vi vil studere ethvert fenomen. I vårt tilfelle er dette fenomenet gjennomsnittslønnen til innbyggerne i et land. Datapopulasjonen består av hver eneste arbeidstaker i landet. Av tids- og kostnadshensyn ville det selvfølgelig være umulig å spørre hver arbeidstaker hva deres årslønn er. Det vil ta lang tid, eller vi trenger mye ressurser.

På dette punktet vises begrepet statistisk utvalg. I stedet for å spørre millioner av arbeidere i et land eller en region, samler vi bare en liten mengde data. For eksempel spurte vi 100.000 mennesker. Denne oppgaven er fortsatt komplisert, men det er mye rimeligere å spørre 100.000 mennesker enn å spørre 30 millioner.

Denne lille mengden data må være representativ. Det vil si at den må representere befolkningen tilstrekkelig. Hvis de 100.000 menneskene vi spurte er konsentrert i velstående nabolag, vil vi få data som ikke er representative. Gjennomsnittslønnen ville være mye høyere enn den egentlig er.

Kjennetegn ved et representativt statistisk utvalg

Hvis du vil gjøre god forskning, er kvaliteten på det statistiske utvalget viktig. Det er ubrukelig å utføre de mest komplekse statistiske beregningene med de mest sofistikerte modellene hvis det statistiske utvalget er partisk. Det vil si hvis prøven ikke er representativ.

Når man får et representativt utvalg, er det visse aspekter som forskeren må vite på forhånd. Blant disse aspektene er egenskapene til et representativt utvalg. Egenskapene til et representativt utvalg er som følger:

  • Stor nok størrelse: Når vi jobber med prøver, jobber vi normalt med en datamengde som er mindre enn befolkningen. For at et statistisk utvalg skal være representativt, må det imidlertid være stort nok til å bli ansett som representativt. For eksempel, hvis befolkningen vår består av 10 millioner data og vi velger 10, er det vanskelig for den å være representativ. Jo større utvalget er selvfølgelig ikke alltid mer representativt.
  • Tilfeldighet: Valg av data fra et statistisk utvalg må være tilfeldig. Det vil si at det må være helt tilfeldig. Hvis vi i stedet for å gjøre det tilfeldig, utfører en planlagt datavalgsprosess, introduserer vi en skjevhet i datainnsamlingen. Derfor, for å unngå at prøven er partisk, og for å gjøre den til et representativt utvalg, må vi ta et tilfeldig utvalg.

Statistisk slutning

Når vi har fått den representative prøven, er det nødvendig å utlede visse beregninger. Ofte er vi interessert i å vite et visst mål på en variabel. I det første eksemplet ville variabelen være lønnen til innbyggerne i et land. I denne forstand er beregningen vi vil analysere gjennomsnittslønnen til innbyggerne i et land.

Vi har med andre ord en datapopulasjon som består av alle arbeidere i Mexico. Fra denne befolkningen får vi en variabel, det vil si årslønnen. Ved hjelp av passende teknikker får vi et representativt utvalg. Og til slutt, når vi har et datasett som vi kan jobbe med, bruker vi statistiske inferensmetoder for å beregne gjennomsnittslønnen.

Når vi først har sett datasettet, kan vi selvfølgelig utlede andre tiltak. For eksempel hvordan lønnen fordeles, hvor mange prosent av arbeidstakerne som er under en viss lønn eller hvor stor er lønnsgapet.

Eksempel på statistisk utvalg

Anta at vi ønsker å gjennomføre en studie om de gjennomsnittlige utgif.webptene til colombianske familier i januar måned. For dette har vi to alternativer:

  1. Skriv inn bankkontoer til alle familier i Colombia
  2. Spør et representativt antall personer

Det første alternativet er ikke levedyktig av flere grunner. For det første at familiene ikke kommer til å gi opp dataene sine, og for det andre at vi ikke kunne gå familie for familie og se på dataene heller. Hovedsakelig fordi befolkningen i Colombia er nærmere 50 millioner. I mellomtiden er det andre alternativet å samle et statistisk utvalg.

Det vi vil gjøre, i henhold til kjennetegnene nevnt ovenfor, vil være å spørre 100.000 familier. Det er noe komplisert, men mye lettere enn å spørre 50 millioner colombianere. Forskjellen er betydelig. Basert på utvalget på 100 000 familier, vil vi prøve å beregne gjennomsnittlig utgif.webpt for familier i januar.

Dataene som ekstraheres, vil være mer eller mindre pålitelige i henhold til en rekke beregninger som blir tatt i betraktning i statistiske undersøkelser. Selvfølgelig er disse typene beregninger mer avanserte, og derfor vil vi ikke diskutere dem her.