Statistisk normalisering - Hva det er, definisjon og konsept

Innholdsfortegnelse:

Anonim

Statistisk normalisering er skalaomdannelsen av fordelingen av en variabel for å kunne sammenligne med hensyn til sett med elementer og gjennomsnittet ved å eliminere effekten av påvirkninger.

Normalisering er med andre ord proporsjoner uten måleenheter (dimensjonsløse eller skalaen uvariante) som tillater oss å sammenligne elementer av forskjellige variabler og forskjellige måleenheter.

I statistikk og økonometri brukes standardiserte sannsynlighetsfordelingstabeller for å finne sannsynligheten for at en observasjon tar gitt fordelingsfunksjonen som variabelen følger.

Det er viktig å ikke begrense normaliseringsperioden bare til sett med elementer der normalfordelingen er en god tilnærming til deres frekvens.

Statistisk variabel

Bord

Følgende tabell beskriver de vanligste standardiseringene i statistikk som brukes til økonomi og økonomi.

  • Den typiserte eller standard poengsummen normaliserer feilene når vi kan beregne prøveparametrene.
  • Normaliseringen i studentens t-fordeling normaliserer restene når parametrene er ukjente, og vi foretar et estimat for å oppnå dem.
  • Variasjonskoeffisienten bruker gjennomsnittet som et målestokk, i motsetning til standardisert poengsum og Studentens t, som bruker standardavviket. Distribusjonen er normalisert for Poisson og eksponensiell distribusjon.
  • Det standardiserte momentet kan brukes på enhver sannsynlighetsfordeling som har en momentgenererende funksjon. Med andre ord at integralene til øyeblikkene er sammenfallende.

applikasjoner

Hvor mange ganger har vi lest at den normale sannsynlighetsfordelingen virker som en god tilnærming til frekvensen av observasjonene, og vi blir bedt om å finne sannsynligheten for at variabelen X tar en spesifikk verdi?

Med andre ord setter vi X ~ N (μ, σ2), og vi blir bedt om å finne P (X ≤ xJeg)

Vi vet at for å finne P (X ≤ xJeg), må vi slå opp sannsynligheten i sannsynlighetsfordelingstabellene. I dette tilfellet, i tabellene over fordelingen av normalfordelingen. De mest brukte sannsynlighetsfordelingstabellene i økonometri og kvantitativ økonomi er: chi-square, Student's t, Fisher-Snedecor's F, Poisson, exponential, cauchy og standard normal.

Sannsynlighetene beregnet i distribusjonstabellene oppfyller egenskapen:

Det vil si at sannsynlighetene (tallene i tabellen) er typisert. Da må vi også skrive variabelen vår i henhold til parametrene til fordelingsfunksjonen hvis vi vil finne sannsynligheten for P (X ≤ xJeg).

Praktisk eksempel

Vi ønsker å vite sannsynligheten for at antallet skiløpere som går på ski en fredag ​​morgen er 288.

Skianlegget forteller oss at frekvensen til skiløpervariabelen kan tilnærme en normalfordeling på gjennomsnitt 280 og varians 16.

Så vi har:

X ~ N (μ, σ2)

der X er definert som variabelen "skiløpere"

De ber oss om sannsynligheten for at antall skiløpere som går på ski på en fredag ​​er mindre enn eller lik 288. Det vil si:

P (X ≤ 288)

Prosess

For å finne sannsynligheten for at antallet skiløpere er lik 288, må vi først skrive inn variabelen.

Så ser vi på fordelingstabellen for den kontinuerlige standardnormalen:

Z 0 1 2 3
2,0 0,9772 0,9778 0,9783 0,9788

Sannsynligheten for at 288 skiløpere vil gå på ski en fredag ​​morgen er 97,72% gitt gjennomsnitt og variansparametere.