Datainnsamlingsskjevhet oppstår når vi feilaktig velger ut fagene som skal tilhøre den tilfeldige prøven som analyseres.
Vi har problemet når dette valget gjør at det tilfeldige utvalget ikke er representativt for den statistiske populasjonen. Derfor er ethvert resultat vi får fra prøven partisk, og vi kunne ikke bekrefte at det ble oppfylt i den analyserte populasjonen. Innenfor denne skjevheten kan vi skille forskjellige typer, noe vi vil forklare nedenfor.
Overlevelsesskjevhet
Oppstår når data er ekskludert fra analysen fordi de ikke lenger eksisterer på tidspunktet for analysen.
Med andre ord fokuserer vi bare på dataene som eksisterer og forkaster de som tidligere eksisterte i befolkningen. I praksis er det mange eksempler på denne typen skjevheter. En av dem er å utføre undersøkelser bare til kundene i et selskap, og utelukke potensielle kunder. Et annet vil være å evaluere oppførselen til aksjeindeksene ved å eliminere selskapene som ikke lenger er i denne indeksen.
Løsningen på denne skjevheten er veldig enkel. Gjennomfør studien med alle data, eksisterende og tidligere eksisterende.
Forventningsskjevhet
Det skjer når en analyse utføres ved hjelp av data som ikke er tilgjengelige på tidspunktet for analysen. Et eksempel kan være å lage en analyse av forholdet mellom prisen på en aksje og en variabel i finansbalansen. Aksjekursen er en dynamisk variabel, hvis vi har riktig informasjon på tidspunktet for analysen. Variablene som er etablert i balansen er imidlertid statiske, og derfor bør vi vente på publiseringen av regnskapet for denne analysen.
Anta at vi vil studere forholdet mellom pris og egenkapital for en rekke selskaper på slutten av regnskapsåret. I dette tilfellet vil vi ikke ha nettoverdien av data før publiseringen av regnskapet. Publisering som vanligvis gis et par måneder etter utgangen av regnskapsåret.
Derfor vil en løsning på denne skjevheten være å vente på publiseringen av regnskapet. Og utfør analysen med publiserte data sammen med prisen på tidspunktet for publiseringen.
Tidsperiode bias
Denne skjevheten oppstår når perioden valgt for dataene er for kort eller for lang. Hvis den er for kort, kan analysen gjenspeile spesifikke resultater som bare oppfylles for den perioden. Det vil si at de ikke ville være representative i lengre tid.
Se for deg en femårs tidsramme der små selskaper har overgått store selskaper på aksjemarkedet. Av dette kunne vi trekke konklusjonen om at små selskaper i fremtiden alltid vil overgå de store. Men i så kort tid kan ingen slike konklusjoner trekkes. Dette skyldes hovedsakelig at situasjonen kan endres i lengre perioder. Derfor er resultatene oppnådd partisk til denne reduserte tidsperioden.