Survival bias - Hva det er, definisjon og konsept

Innholdsfortegnelse:

Anonim

Overlevelsesskjevhet er en skjevhet som oppstår i datainnsamlingen når data ekskluderes fra analysen fordi de ikke lenger eksisterer i dag.

Denne skjevheten oppstår i et bredt spekter av sammenhenger der vi bare fokuserer på de "overlevende" dataene. Et eksempel på dette ses når bedrifter undersøker kundene sine om et av produktene deres. Men de lar sine ikke-klienter, som i dette tilfellet ville være "ikke-overlevende", i glemmeboken.

I dette tilfellet ville det være feil å trekke konklusjoner fra den studien. Siden resultatene bare ville være partiske for den "overlevende" befolkningen. Og de ville ikke være representative resultater.

Overlevelsesskjevhet i praksis

Et tydelig eksempel på denne skjevheten kan sees i studien av resultatene fra investeringsfond. Hvor de fleste databaser bare inneholder midler som eksisterer i dag. Uavhengig av midlene som eksisterte tidligere.

Årsaken til at de ikke eksisterer i dag er fordi prestasjonene deres har vært dårligere enn de “overlevende”. Eller til og med flere fond er slått sammen til ett. Derfor blir analysen utført på de fondene som har de beste resultatene. Og denne skjevheten har en tendens til å overvurdere ytelsen til utvalget av disse midlene.

Hovedproblemet med dette er ikke lenger bare overvurderingen av fondets resultater. Snarere vil ikke det utvalgte utvalget være et tilfeldig utvalg av den totale befolkningen. Og derfor kan ikke resultatene av studien være representative for befolkningen. At det til slutt er det vi ser etter når vi velger et tilfeldig utvalg av befolkningen.

Løsning på overlevelsesforstyrrelse

La oss forestille oss at vi ønsker å velge et investeringsfond å investere i, basert på tidligere oppførsel. For å unngå denne overlevelsesforstyrrelsen og optimalisere dette valget, bør vi utføre følgende trinn:

  • Velg tidshorisonten vi planlegger å jobbe med. For eksempel ti, femten eller tjue års historie.
  • Ta alle eksisterende midler fra begynnelsen av tidshorisonten, enten de eksisterer eller ikke for øyeblikket.
  • Derfra velger du prøven fra den populasjonen for studiet av atferd.

Ideen med dette er til slutt å få det tilfeldige utvalget av befolkningen. Og derfra oppnådde konklusjonene om de kunne være representative for den befolkningen.