Chebyshevs ulikhet er en setning som brukes i statistikk som gir et konservativt estimat (konfidensintervall) av sannsynligheten for at en tilfeldig variabel med endelig varians vil være i en viss avstand fra dens matematiske forventning eller gjennomsnittet.
Dens formelle uttrykk er som følger:
X = Anslått verdi
µ = Matematisk forventning om estimert verdi
Ϭ = Standardavvik for forventet verdi
k = Antall standardavvik
Ut fra dette generelle uttrykket og utvikle den delen som forblir innenfor den absolutte verdien, vil vi ha følgende:
Hvis vi tar hensyn til det forrige uttrykket, kan det sees at delen til venstre ikke er mer enn a konfidensintervall. Dette gir oss både en nedre og en øvre grense for den estimerte verdien. Derfor forteller ulikheten i Chebyshev oss minst sannsynligheten for at populasjonsparameteren er innenfor et visst antall standardavvik over eller under gjennomsnittet. Eller på en annen måte, det gir oss sannsynligheten for at populasjonsparameteren er innenfor det konfidensintervallet.
Chebyshevs ulikhet gir omtrentlige grenser for den estimerte verdien. Til tross for å ha en viss grad av upresisjon, er det en veldig nyttig setning siden den kan brukes på et bredt spekter av tilfeldige variabler uavhengig av fordelingen. Den eneste begrensningen for å kunne bruke denne ulikheten er at k må være større enn 1 (k> 1).
Matematisk ulikhetEksempel på anvendelse av Chebyshevs ulikhet
Anta at vi er forvaltere av et investeringsfond. Porteføljen vi forvalter har en gjennomsnittlig avkastning på 8,14% og et standardavvik på 5,12%. For å vite for eksempel hvilken prosentandel av avkastningen som er minst 3 standardavvik fra gjennomsnittlig lønnsomhet, vil vi bare bruke den forrige formelen for uttrykk 2.
k = 1,96
Erstatter verdien av k: 1- (1 / (1,96 2)) = 0,739 = 73,9%
Dette betyr at 73,9% av resultatene ligger i konfidensintervallet lokalisert til 1,96 standardavvik fra gjennomsnittet.
La oss gjøre det forrige eksemplet for andre verdier enn k.
k = 2,46
k = 3
Erstatter verdien av k: 1- (1 / (2,46 2)) = 0,835 = 83,5%
Erstatter verdien av k: 1- (1 / (3 2)) = 0,889 = 88,9%
Det er 83,5% av dataene som ligger i en avstand på 2,46 standardavvik fra gjennomsnittet og 88,9% som ligger innenfor 3 standardavvik fra gjennomsnittet.
Ved å bruke Chebyshevs ulikhet er det lett å utlede at jo høyere verdien til K (jo større avviket til den estimerte verdien fra gjennomsnittet), jo større er sannsynligheten for at den tilfeldige variabelen er innenfor det avgrensede intervallet.
KurtosisSentral grensesetningUlikhet