I dette innlegget forklarer vi egenskapene til studentens t-fordeling.
Med andre ord er t-fordelingen en sannsynlighetsfordeling som estimerer verdien av gjennomsnittet av et lite utvalg hentet fra en populasjon som følger en normalfordeling som vi ikke kjenner standardavviket for.
Anbefalte artikler: frihetsgrader, frihetsgrader (eksempel) og normalfordeling.
Historie
William Sealy Gosset (1876-1937) i 1908 hadde behov for å lage en distribusjon for å hjelpe ham med statistiske beregninger av øl fra Guinness i Irland. Siden resultatene måtte publiseres ved hjelp av private data fra bryggeriet for å demonstrere anvendeligheten av den nye distribusjonen, forbød selskapet sine ansatte å publisere konfidensiell informasjon. Denne begrensningen hindret ikke Gosset i å publisere sitt funn under pseudonymet for Student. Fra det øyeblikket blir t-fordelingen anerkjent som studentens t-distribusjon.
Egenskaper for studentens fordeling
Egenskapene til studentens fordeling er som følger:
- Det er en symmetrisk fordeling. Verdien av gjennomsnittet, medianen og modusen faller sammen. Matematisk,
- Det er en unimodal fordeling. Verdiene som er hyppigere eller som er mer sannsynlige (modus) er rundt gjennomsnittet. Når vi beveger oss bort fra gjennomsnittet, reduseres sannsynligheten for at verdiene vises og frekvensen deres.
- Hvis vi har et utvalg av størrelse n, vil vi ha en t-fordeling med (n-1) frihetsgrader.
Fordelingen vil med andre ord ha samme antall observasjoner på begge sider av den sentrale verdien.
- Tetthetsfunksjonen avhenger ikke av frihetsgraden for å være symmetrisk.
- Den grafiske representasjonen ser ut som normalfordelingen, det vil si at den også er klokkeformet.
- Midt- eller mellomverdien er null (0).
- Jo mer frihetsgrader øker, jo mer lik t-fordelingen normalfordelingen.
Normalfordeling vs t fordeling
T-fordelingen og normalfordelingen skiller seg hovedsakelig fordi t-fordelingen tillegger større sannsynlighet for ekstreme observasjoner enn standard normalfordeling (varians større enn 1). Med andre ord har t-fordelingen bredere haler enn normalfordelingen.