Type I feil - Hva er det, definisjon og konsept

Innholdsfortegnelse:

Type I feil - Hva er det, definisjon og konsept
Type I feil - Hva er det, definisjon og konsept
Anonim

Type 1-feil i statistikk er definert som avvisning av nullhypotesen når den faktisk er sant. En type 1-feil er også kjent som en falsk positiv eller type alfa-feil.

Å gjøre en type 1 feil er i utgangspunktet å nekte noe når det faktisk er sant. Tenk for eksempel situasjonen med å teste om en markedsføringskampanje utført på sosiale nettverk øker salget av is til et selskap i løpet av en sommeruke. Hypotesene vil være følgende:

H0: Salget øker ikke på grunn av sommerkampanjen

H1: Salgsøkning på grunn av markedsføringskampanje

Etter å ha evaluert trafikken på selskapets nettside og sidene som er besøkt etter kampanjen, oppdages følgende:

  • Øk, men i trafikk og besøk på 50%.
  • 200% økning i iskremsalget.

På bakgrunn av disse resultatene kan det konkluderes med at reklamekampanjen har vært fruktbar og har hatt en banebrytende effekt som øker salget. La oss imidlertid tro at den uken var det en hetebølge som brakte temperaturene over 40 grader.

Når vi vet sistnevnte, må vi ta hensyn til faktoren høy temperatur som årsak til økningen i salget. Hvis vi ikke tar dette i betraktning, kan vi avvise vår nullhypotese når det er sant, det vil si at vi skulle tenke at kampanjen vår hadde vært en rungende suksess når årsaken til økningen i salg i virkeligheten var den sterke varmen. Hvis vi nådde denne konklusjonen, ville vi avvise nullhypotesen når den faktisk er sant og derfor begår en type 1-feil.

Årsaker til type 1 feil

Type 1-feilen er relatert til betydningen av kontrasten eller alfa, med feilen ved estimering av koeffisientene og kan oppstå på grunn av to typiske brudd på startantakelsene om en regresjon. Disse er:

  • Betinget heteroscedasticitet.
  • Seriekorrelasjonen.

En regresjon som presenterte noen av de tidligere bruddene, ville undervurdere koeffisientens feil. Hvis dette skjer, vil vårt estimat av t-statistikken være større enn den faktiske t-statistikken. Disse større verdiene av t-statistikken vil øke sannsynligheten for at verdien faller inn i avvisningssonen.

La oss forestille oss to situasjoner.

Situasjon 1 (feil feilestimat)

  • Betydning: 5%
  • Prøvestørrelse: 300 mennesker.
  • Kritisk verdi: 1,96
  • B1: 1,5
  • Koeffisient estimeringsfeil: 0,5

T = 1,5 / 0,5 = 3

På denne måten ville verdien falle i avvisningssonen, og vi ville avvise nullhypotesen.

Situasjon 2 (riktig feilestimat)

  • Betydning: 5%
  • Prøvestørrelse: 300 mennesker.
  • Kritisk verdi: 1,96
  • B1: 1,5
  • Koeffisient estimeringsfeil: 1

T = 1,5 / 1 = 1,5

På denne måten ville verdien falle i sonen for ikke-avvisning, og vi ville ikke forkaste hypotesen.

Basert på de foregående eksemplene, vil situasjon 1 der feilen er undervurdert, føre til at vi avviser nullhypotesen når det faktisk er sant, siden vi ser i situasjon 2 med riktig estimert feil, ville vi ikke avvise hypotesen å være sann.