Maskinlærte data

GDPR-vennlige data til test eller analyseformål

Maskinlæring kan brukes til så meget, deriblant å lage rike syntetiske data. Relativt enkle maskinlæringsteknikker sikrer nye datasett som statistisk ligner på det originale datasettet. Disse nye datasettene kan deretter benyttes som testdata i utviklingsmiljø, så man kan skjerme utvikleres innsyn i forretningskritisk eller personsensitiv informasjon, samtidig som de får realistiske data de kan jobbe med.

De samme teknikkene kan også brukes til anonymisering av datasett til bruk i f.eks. maskinlæring, eller man kan lage et større datasett enn man hadde tilgang til i utgangspunktet.

Vil du vite mer om maskinlærte testdata? Meld deg på gratis frokostseminar 28. november >


 

Maskinlærte data har et stort potensial, og vi kan blant annet levere løsninger som understøtter følgende problemstillinger:

GDPR-vennlige testdata

Maskinlærte testdata kutter tråden mot ekte persondata gjennom følgende prosedyre:

  • Ekstraksjon av grunndata
  • Pseudonymisering ved å bytte ut unike identifikatorer med løpenummer (f.eks. fødselsnummer).
  • Tar bort egenskaper som ikke er kritiske å beholde (f.eks. navn)
  • Trening av statistisk modell
  • Trekker ut så mange eksemplarer av dataene man ønsker gjennom å sample den bygde modellen.

BeAn (Beyond Anonymous)

BeAn er et fleksibelt rammeverk som bygger på maskinlæringsmetoden CART (classification and regression trees).

Denne metoden egner seg veldig bra å bruke på datasett med attributter som er avhengige av hverandre. BeAn sørger for at disse korrelasjonene blir opprettholdt i det nye datasettet som blir bygget.

Maskinlæring på skjermede data

Maskinlæring blir mer og mer populært å bruke for å oppnå avansert innsikt i data. Ikke alle ønsker å levere ut dataene sine, enten til en skyleverandør, eller til et analysefirma. Et ferdiglagd skjermet datasett kan sendes opp i skyen eller til dine data scientists laptoper.

Data med historikk

I tilfeller der man er avhengige av en spesiell historikk, eller der man ønsker å følge et objekt over et lengre tidsrom, har vi løsninger for det også. I mange av disse tilfellene kan det passe med et tilpasset Recurrent Neural Network (et nevralt nettverk som tilpasser seg tidsseriemodellering). I mange tilfeller har vi allerede laget en passende arkitektur tidligere, men om dine data har spesielle behov tilpasser vi et nettverk fra bunnen av.

Vi leverer løsninger for maskinlærte datasett der dataene dine er, men vi baserer oss i hovedsak på python og R.
Ledige stillinger illustrasjon

Jobb hos oss?

Enten du er erfaren konsulent og på leting etter noe nytt, eller nyutdannet og klar for å starte din karriere som konsulent, kan det lønne seg å holde øye med våre utlysninger. Konsulentenheten i Visma består pr i dag av ca 150 nyskapende kvinner og menn. I årene som kommer skal vi vokse enda mer. Vi rekrutterer 15-20 nyutdannede hvert år, og ansetter i tillegg dyktige mennesker med erfaring fra IT- og konsulentbransjen.

Ledige stillinger

Kontakt oss

Er du interessert, eller lurer på hva vi kan tilby deg, send oss en melding så tar vi kontakt.

JA, jeg gir samtykke til behandling av mine personopplysninger for å kartlegge mine interesser som beskrevet her og er kjent med at samtykket kan trekkes tilbake når som helst.

JA, jeg vil motta relevant informasjon basert på mine interesseområder fra Visma på e-post. Jeg kan når som helst melde meg av eller oppdatere mine interesser på Vismas abonnementsside.

Vi trenger ditt samtykke.

Portrett av en Visma konsulent

Vi bruker cookies for å registrere din aktivitet på våre nettsider. Denne informasjonen kombinerer vi med opplysningene du oppgir for å danne en profil, slik at vi kan vise deg innhold tilpasset dine interesser. Ved å akseptere, tillater du oss å registrere og behandle din persondata som beskrevet her.