Signifikansnivåene er komplementet til konfidensintervallet til en fordeling og brukes til å teste nullhypotesen (H0) i en test av statistisk inferens.
Med andre ord er signifikansnivåene sannsynligheten for at vi lar være utenfor konfidensintervallet for en fordeling og hjelper oss med å avgjøre om teststatistikken er i avvisningssonen eller ikke.
Forholdet mellom grad av betydning og nivå av tillit
Sikkert har vi alle hørt noen spør hvilken verdi vi skal tildele alfaen til fordelingen eller med hvilket tillitsnivå vi beregner intervallet, matematisk, (1-alfa). Svaret er vanligvis alltid 1%, 5% eller 10% for alfa eller 99%, 95% og 90% for konfidensnivået.
Det er viktig å være tydelig på følgende:
- 1%, 5%, 10% = alfa => Betydningsnivåer.
- 99%, 95%, 90% = (1-alfa) => Konfidensintervall.
Konfidensintervallene og signifikansnivåene er komplementære siden summen av begge er området for tetthetsfunksjonen. Deretter,
Vi vet allerede at området for tetthetsfunksjonen er 1. Matematisk er vi i stand til å løse denne integralen:
Representasjon av betydningsnivået
I dette tilfellet har studentens t-fordeling med 16 frihetsgrader blitt brukt for å vise hvilke områder av funksjonen som hører til signifikansnivåene. Prosentandelen (2,5%, 2,5% og 95%) tilsvarer arealet under tetthetsfunksjonen. Siden denne fordelingen har to haler, deles signifikansnivået i to, så 2,5% + 2,5% = 5%. Den kritiske verdien av denne fordelingen med 16 frihetsgrader og 5% som signifikansnivå er 2.11991 i hver hale.
2,5% + 2,5% + 95% = 1%
Universell
Vi markerer nivåene av betydning som universelle fordi disse nivåene er kjent og brukes i alle statistiske tester. Det er veldig uvanlig å finne et signifikansnivå på 20% eller 35% med mindre det er en eksplisitt testtilstand.
Det er sant at nivå 1% og 5% er mer populære enn nivå 10%, men det er av nøyaktighetsgrunner. Det er bedre å gi et resultat 1 av 100 ganger (1/100 = 0,01 = 1%) eller 5 av 100 ganger (5/100 = 0,05 = 5%) enn 10 av 100 ganger (10/100 = 0,1 = 10%), ikke sant?
Betydningsnivåene kalles også en persentil, for eksempel 1% persentil eller 5% persentil. Denne nomenklaturen brukes mye til å beregne beregningen av VaR-verdien.
Vilkårlig og ikke-vilkårlig
Signifikansnivåene kan være vilkårlige og ikke vilkårlige. De vilkårlige er verdiene vi velger a priori (før) å kjenne til egenskapene til eksperimentet. I dette tilfellet vil det være før du beregner teststatistikken. De ikke-vilkårlige er de som er hentet fra et resultat av eksperimentet. I dette tilfellet p-verdien, fordi det avhenger av verdien som tas av teststatistikken. Begge avhenger av fordelingen som dataene følger.