Med Strava Metro kan man se hvordan sykkelpendlere ferdes i f.eks. Oslo (https://labs.strava.com/heatmap/#14/10.74256/59.91567/gray/both)

Big data, personvern og innsikt

Boka «Moneyball» av Michael Lewis (eller filmen med samme navn) viser hvordan et eksempel på big data kan benyttes for å få innsikt som ellers hadde gått upåaktet hen. For at big data skal gi innsikt og verdi forutsettes det at en relativt stor mengde data foreligger. Store datamengder kan imidlertid være en utfordring for personvernet.

Balansegangen mellom data og personvern er viktig – og ansvaret hviler både den enkelte og på den som samler inn data. Hilde Visthoff Drange skrev forleden et veldig interessant og dagsaktuelt innlegg om personvern, som er relevant i diskusjoner om big data. Som Hilde konkluderte med er den viktige samfunnsmessig utfordringen å heve kjennskap til og kunnskap om personvern.

Dette innlegget handler om to ting:

  1. Verdien av big data
  2. Big data og personvern

 

Verdien av big data

Tre elementer må være på plass for at dataene skal være verdifulle for beslutningstakere («Big data» av Cukier og Mayer-Schonberger, 2013):

  1. Dataene må eksistere: De fleste organisasjoner har tilgang til mye data, både internt og fra eksterne kilder.
  2. Dataenes bruksområder må være tydelige: Dette er kanskje den største utfordringen per i dag – men etter hvert som organisasjoner blir vant med å håndtere store mengder data vil de også få bedre forståelse av hva de skal gjøre med det.
  3. Dataene må bearbeides: Data i råformat har lite nytte i seg selv med mindre det kan bearbeides til å tjene et formål.

Hva er mest verdifullt? Å være god til å bearbeide eller å eie dataene?

I dag er det nok større etterspørsel etter mennesker som har kompetanse om hvordan man skal bearbeide dataene, men etter hvert som kunnskapsnivået øker i organisasjonene og bruksområdene blir tydeligere, er det selve dataene som vil være av størst verdi.

For private aktører er det gjerne finansielle motiver som driver frem bruken av big data. Google og Facebook bruker big data blant annet til å forbedre målrettet markedsføring, Netflix og Amazon for å gi bedre film- og bokanbefalinger, og så videre.

Eksempel 1: Kunnskap om sykkelpendling

Som en veldig ivrig hobbysyklist vil jeg trekke frem et samfunnsnyttig eksempel fra Strava, som er en treningsapp som de fleste syklister og løpere kjenner til. Ved å registrere GPS-koordinater sammen med annen informasjon som tid og puls under en treningsøkt kan den enkelte Strava-bruker se hvor han har syklet og løpt og sammenlikne sine tider mot andre Strava-brukere på utvalgte «segmenter» eller strekninger (Oslo-pendlere har et kjært forhold til blant annet «Tour de Finans»). Hver uke lastes det opp 2,5 millioner økter verden over (antall i Norge vil de ikke oppgi), og ifølge Strava er omtrent halvparten av alle registrerte økter i forbindelse med pendling. Strava har derfor en unik innsikt i hvordan syklister pendler inn og ut av byer, og innsikten er tilgjengelig for de som ønsker det via tjenesten Strava Metro.

Flere byer verden over har nå kjøpt tilgang til tjenesten med mål om å bruke det til å bedre forstå hvilke veier pendlere bruker og dermed kunne drive bedre byplanlegging (les mer hos Wall Street Journal).

Når man titter ut på Dronning Eufemias Gate på Bjørvika i Oslo kan man tenke seg at Oslo kommune burde gjort det samme…?

Med Strava Metro kan man se hvordan sykkelpendlere ferdes i f.eks. Oslo. På verdensbasis har Strava i skrivende stund 77,7 millioner sykkeløkter, 20,7 millioner løpeturer og totalt 220 milliarder datapunkter å basere innsikten sin på. (Se https://labs.strava.com/heatmap/#14/10.74256/59.91567/gray/both)

Med Strava Metro kan man se hvordan sykkelpendlere ferdes i f.eks. Oslo. På verdensbasis har Strava i skrivende stund 77,7 millioner sykkeløkter, 20,7 millioner løpeturer og totalt 220 milliarder datapunkter å basere innsikten sin på (se Strava Metro for interaktivt heatmap).

I motsetning til aktører i privat sektor er mandatet til aktører i offentlig sektor typisk å forvalte offentlige midler til fellesskapets beste . Eksempler kan være tilskuddsforvaltning, transport, helse-, omsorgs- og utdannings- velferdstjenester til alle. Big data kan være minst like nyttig for disse.

Eksempel 2: Big data i New York City

Hvert år begynner hundrevis av kummer å ulme, og noen eksploderer. På Manhattan alene er det over 51.000 kumlokk og servicebokser. Ved å systematisere en ekstrem mengde informasjon om kablene (106 variabler) fant de til slutt ut at alder på kabler og tidligere uhell kunne identifisere hvilke kumlokk som trengte vedlikehold mest. Resultatet er at NYC har gått fra tilfeldig til målrettet vedlikehold av kumlokk, og dermed redusert faren for ulmende og eksploderende kumlokk betydelig.

Eksempel 3: Big data i Utdanningsdirektoratet

Utdanningsdirektoratet har tilgang til store mengder data og en klar formening om hva de skal ha ut av det: Økt tilgjengelighet til statistikk av høy kvalitet. Etterspørselen etter statistikk fra direktoratet er høy, men med deres nye system som er utviklet sammen med Visma Consulting, vil Utdanningsdirektoratet kunne hente inn og kontrollere data mer effektivt, bearbeider og anonymiserer informasjonen, og gjør den allment tilgjengelig i interaktive rapporter – både for allmennheten og for interessenter i skolesystemet.

Med statistikkløsningen kan Utdanningsdirektoratet omdanne enorme datamengder til relevant innsikt både for Utdanningsdirektoratet selv, men også for alle andre som er interessert i hvordan utdanning i Norge fungerer.

 

Det finnes utrolig store mengder data allerede, og mengden kommer til å øke i raskere takt enn vi har sett frem til nå. Nytteverdien av å bruke og kombinere data er veldig stor, og vi har nok bare sett begynnelsen av hvordan big data vil endre hvordan organisasjoner agerer. Det er med andre ord fortsatt stort rom for de som er kreative med hensyn til bruksområder!

 

Big data og personvern

For å aggregere meningsfylt data hender det ofte at man må hente inn data som kan være personlig. Eksempler på personlig data kan være personnummer, kredittkortinformasjon, telefonnumre, adresser, GPS-koordinater, registreringsnumre, og så videre.

Datainnhenting blir stadig enklere og rikere ettersom det er et økende antall devices som er i stand til å registrere stadig mer data fortløpende. De nyeste smarttelefonene kan gjøre og måle ting som ville vært helt utenkelig bare for noen få år tilbake. Google Glasses har kommet på markedet, og bruksområdene kan være mange. «The internet of things» åpner uendelig mange muligheter. Bare tenk hvordan ting kan være om fem til ti år frem i tid!

For enkeltindivider er det aktuelt å tenke på hva slags informasjon man gir fra seg. Det å være bruker av sosiale medier eller å avgi informasjon til offentlige myndigheter legger igjen elektroniske spor. Tillit til organisasjoner man gir fra seg informasjon til, at de har gode rutiner for å ivareta informasjon om den enkelte og ikke misbruker dataene er i økende grad relevant.

Et spesielt ansvar for å ivareta personvernet hviler på dersom innhenter, bearbeider og tilgjengeliggjør informasjon. Det er ikke nødvendigvis de som som besitter dataene er de samme som de som jobber med dataene. Sikkerhet og personvern er derfor viktig å tenke på ved valg av leverandør: Har de innleide ressursene tilstrekkelig erfaring og kompetanse, og forstår de organisasjonen godt nok til å levere en løsning som dekker behovene?

Utdanningsdirektoratet henter inn store mengder informasjon om skoleelever i Norge, inkludert personnummer, skole, klassetrinn, fag, karakterer og mer. Med den generiske datamodellen vi har utviklet kan vi ivareta sikkerhet og personvern i tråd med Utdanningsdirektoratets krav om forsvarlig behandling av individdata: Systemet krypterer all individdata på vei inn, og all data som kan indentifisere enkeltindivider blir automatisk anonymisert.

Visma Consulting tar sikkerhet og personvern på alvor. Datamodellen vi benytter for å levere løsningen hos Utdanningsdirektoratet er generisk, og kan tilpasses de fleste typer datasett.

 

Oppsummering

Big data kan gi de fleste organisasjoner verdifull innsikt, det være seg bedre innen kundeatferd eller kvalitet på utdannelse i grunnskolen. Baksiden av medaljen er selvfølgelig at for at big data skal ha verdi så må data foreligge, og gjerne i store mengder. Og fordi overgangen fra «nok data» til «for mye data» er glidende, er personvern av spesiell interesse. Hvordan aktørene håndterer denne delikate balansegangen vil nok følges tett, både av politikere, næringslivet og andre interessenter.

Erik Amit Nordlie er økonomidirketør og tidligere Information Management-konsulent i Visma Consulting. Han har jobbet i IT-bransjen siden 2005 og er spesielt interessert i business intelligence.
Kontakt Erik: