Datavitenskap - Hva det er, definisjon og konsept

Datavitenskap er en disiplin som studerer hvor en viss informasjonsbase kommer fra. Den diskuterer også hvordan disse ressursene kan tolkes og representeres for produktiv bruk.

Datavitenskap er det som er relatert til styring av databaser, lagret i digitale filer, hvor mye nyttig informasjon kan hentes ut som statistiske indikatorer. Disse kan for eksempel hjelpe et selskap til å ta forretningsbeslutninger.

På samme måte gir datavitenskap verktøy som tillater ikke bare å tolke, men også å representere, for eksempel, i bilder, de tilgjengelige dataene. Dermed har vi blant annet histogrammet, stolpediagrammet, kakediagrammet.

Som det kan trekkes, er denne vitenskapen tverrfaglig siden den hovedsakelig dekker kunnskap om matematikk, statistikk og informatikk.

Datavitenskap og datatyper

Det skal også bemerkes at datavitenskap kan fungere med to typer data:

  • Strukturert: Det er de som er organisert, for eksempel de tabellene med forskjellige kolonner, hver med en annen kategori som: navn, etternavn, alder, identitetsdokumentnummer, etc.
  • Ustrukturert: De som ikke samsvarer med et bestemt format, for eksempel en fritt skrevet tekst. I så fall må du tolke innholdet og trekke ut data som kan administreres.

Med tanke på alt som er forklart, må fagpersoner spesialisert innen datavitenskap ikke bare ha analytiske ferdigheter, men de må kunne kommunisere innholdet i informasjonen de har behandlet.

Viktigheten av datavitenskap

Datavitenskap er viktig for selskaper eller institusjoner som må jobbe med en stor mengde data. Dermed kan disse bli verdifull informasjon.

Vi kan knytte datavitenskap til Big Data, som består av å utvikle mekanismer som er i stand til å behandle og administrere massive data som kommer fra forskjellige kilder. Målet er å konvertere dem til informasjon som kan tolkes av mennesket, og som hjelper ham med å ta beslutninger.

Disse dataene som skal behandles kan komme fra transaksjoner mellom enkeltpersoner og organisasjoner (for eksempel bankvirksomhet), daglige handlinger fra mennesker (for eksempel søk på Internett), maskiner (for eksempel mobiltelefonens GPS som registrerer hvor brukeren har vært) eller informasjon biometrisk (for eksempel fingeravtrykk).

Datavitenskapens historie

Det kan sies at den amerikanske statistikeren John Wilder Tukey var pioner innen datavitenskap på 1960-tallet, og understreket viktigheten av å analysere data i stedet for å teste statistiske modeller.

Imidlertid var det først i 1996 at begrepet datavitenskap ble brukt for første gang i tittelen på et foredrag, i foredraget kalt: "Datavitenskap, klassifisering og relaterte metoder." Dette, innenfor rammen av møtet for medlemmer av ‘International Federation of Classification Societies’ (IFCS) som ble holdt i Kobe, Japan.

En annen viktig milepæl kom i 2005 da "Long-Lived Digital Data Collections Enabling Research and Education in the 21st Century" ble utgitt av The National Science Board. I dette dokumentet defineres dataforskere som dataeksperter, database- og programvareprogrammerere og fagpersoner fra andre fagområder (som bibliotekarer og arkivister), som er avgjørende for vellykket styring av en digital datainnsamling.

Dette er imidlertid fortsatt et studieretning som fremdeles er under utvikling.