P-verdi - Hva er det, definisjon og konsept

Innholdsfortegnelse:

Anonim

P-verdien, fra engelsk, p-verdi, er det minste ikke-vilkårlige signifikansnivået som vi kan avvise nullhypotesen (H0) gitt en fordelingsfunksjon og en teststatistikk.

Med andre ord er p-verdien den minste sannsynlighet definert av fordelingen som vi kan avvise nullhypotesen (H0) uten å måtte definere a priori signifikansnivået for kontrasten.

Hvis du husker det, vil du huske at området under kurven til fordelingsfunksjonen er en sannsynlighet. Så fra dette synspunktet vil p-verdien være sannsynligheten for å observere en så ekstrem teststatistikk for at nullhypotesen skal være sant.

Domene

Siden p-verdien er en sannsynlighet, vil denne verdien være mellom 0 og 1.

Ikke vilkårlig

I motsetning til signifikansnivåene som vi er mer vant til å se, for eksempel 1%, 5% og 10%, avhenger p-verdien av fordelingsfunksjonen som teststatistikken har. Så nivåene på 1%, 5% og 10% avgjøres i begynnelsen av kontrasten. Dette valget kalles vilkårlig.

P-verdi formel

P-verdien er ikke en enkelt verdi som den kritiske verdien, men vil avhenge av statistikken. For forskjellige verdier av teststatistikken vil den kritiske verdien være den samme. På den annen side, for forskjellige verdier av teststatistikken, vil p-verdien også være forskjellig, fordi p-verdien avhenger av verdien som teststatistikken tar.

Hvor,

  • D, er en tilfeldig variabel som følger en viss fordeling.
  • d, er verdien av teststatistikken.

Beregning

Det er mulig å beregne p-verdien for hånd, men du må ha veldig presise fordelingstabeller, det vil si med mange desimaler fordi p-verdien har en tendens til å være liten. De fleste statistiske programmer har allerede innlemmet p-verdien, og den vises normalt i resultatet av estimeringsresultatene av Ordinære minste kvadrater (OLS). Det kan virke vanskelig å bruke, men med praksis er det et veldig nyttig verktøy.

For å beregne p-verdien trenger vi:

  • Kontraststatistikk.
  • Fordelingen av kontraststatistikken og å kjenne parametrene.

Avvisningsregel

Hvis p-verdi < signifikansnivå => H0-avvisning.

Hvis p-verdi > signifikansnivå => Ingen avvisning H0.

Representasjon

Når det gjelder en students t-fordeling med 2 frihetsgrader og en kontraststatistikk lik 3, er sannsynligheten for å finne en så ekstrem statistikk når nullhypotesen (H0) er sant 4,77%.

Med andre ord, hvis nullhypotesen (H0) var sant, ville en statistikk så stor som 3 bare bli observert 4,77% av tiden.

Hvorfor kalles det p-verdi?

Navnet på p-verdien har sitt opphav i definisjonen som refererer til å være området under kurven til fordelingsfunksjonen utenfor konfidensintervallet. Siden dette området er den minste sannsynligheten for å avvise nullhypotesen, refererer "p" av p-verdi til sannsynlighet. Og siden p-verdien tilsvarer et tall, og derfor en verdi, tilskrives ordet "verdi" av p-verdi den numeriske figuren. I noen bøker kan vi finne "sannsynlighetsverdi" som refererer til p-verdien. Kanskje å si "minimal sannsynlighet for å avvise nullhypotesen" var for lang og holdt ikke noe mysterium for studentene …