The Alexandra Institute // Aktuelt // Nyheder // 2020 // Sådan gør anonymisering det muligt at få mere ud af dine fortrolige data

Sådan gør anonymisering det muligt at få mere ud af dine fortrolige data

Artikel

14-04-2020

Sådan gør anonymisering det muligt at få mere ud af dine fortrolige data

Både det offentlige og virksomheder ligger inde med store mængder data, som de ikke kan dele og anvende uden at kompromittere borgernes anonymitet. Der findes en lang række teknologier, der gør det muligt at dele data uden at kompromittere fortroligheden. Et af værktøjerne er anonymisering.

Vi har nedenfor samlet en række eksempler på situationer, hvor det er muligt at anvende data ved hjælp af anonymisering.

Energidata i anonymiseret form

Det første eksempel handler om de store mængder forbrugsdata, der ligger i Energinets enorme database, DataHub.

Som det er i dag, kan man enten trække sine egne forbrugsdata ud eller man kan trække aggregerede data ud fra f.eks. for en hel kommune. Men i mange tilfælde er datasættet så stort, at man ikke kan bruge det til noget.

Det kan f.eks. være relevant for en virksomhed, der ønsker at screene en branche. Eller det kan være relevant for et boligselskab, der godt vil vide noget om en bestemt boligblok for at se, hvordan og hvornår der bruges strøm. Det kunne også være, at de var interesseret i at se på bestemte bydele i forhold til energioptimering.

Her har Energinet organiseret et sprint for at finde tekniske løsninger, der gør det muligt at åbne for datahub’en uden at kompromittere forbrugernes anonymitet. I dette sprint deltog eksperter fra bl.a. Alexandra Instituttet, Syddansk Universitet og Danmarks Statistik.

Læs mere om det her

Anonymisering af persondata

Det andet eksempel er fra BørnUngeLiv, som står bag et redskab, der understøtter kommunernes store indsats for, at børn og unge trives godt. Redskabet er baseret på spørgeskemaer, som børn og unge udfylder hvert andet år gennem deres skolegang.

Sundhedsplejersken ser svarene og bruger dem som udgangspunkt for en samtale med børnene. Herudover genererer de også statistiske rapporter til kommunerne, som f.eks. kan gå ind og se på, hvordan det står til med trivslen på en hel årgang.

Det drejer sig om følsomme data, som selvfølgelig skal anonymiseres, men samtidig skal rapporterne også være informative for kommunerne.

Her har Alexandra Instituttets eksperter rådgivet dem om, hvad de skulle gøre. Udfordringen var både at forstå, hvilke data de havde, hvad de ønskede at gøre med dem, og hvordan deres eksisterende setup er.

Analyser på tværs af databaser

Det tredje eksempel er et projekt, der hedder HedaX. Det tager udgangspunkt i, at Danmarks Statistik og Sundhedsstyrelsen hver ligger inde med deres data om de samme mennesker – nemlig hele Danmarks befolkning.

Til forskningsmæssige formål kan det gøre det en smule vanskeligt, da man kan ikke må kombinere de to databaser. Det kan der være god nok grund til, at man ikke må, men man kan være interesseret i at udregne sammenhænge. Er der f.eks. en sammenhæng mellem en bestemt lidelse og nogle bestemte socioøkonomiske forhold?

Her er Alexandra Instituttet i samarbejde med en lang række partnere i gang med at udvikle et system, der gør det muligt at lave analyser på tværs af databaserne, uden at der foregår en samkøring af data, og den enkelte borgers data forbliver beskyttet.

Træner model og data for sig

Det fjerde eksempel hedder ‘federated learning’, der er en maskinlæringsløsning, hvor du adskiller modellen fra de data, du træner på.

Lad os sige, at du har to forskellige datasæt, og du gerne vil have en model, der er trænet på alle data. I stedet for at stykke dataene sammen ét sted og træne modellen der, så sender man i stedet modellen rundt til de parter, der har datasættene, og træner modellen hver for sig. Derefter stykker man modellerne sammen.

Man ser aldrig hinandens data, men man kan få en model, der er næsten lige så god, som hvis man havde trænet dem sammen.

Teknikken er brugt af Google til at udvikle en model, der kan forudsige, hvilken emoji du taster næste gang - er det en sur eller smilende emoji? I stedet for at Google henter alle de sms’er ind, som folk nogensinde har skrevet, og prøver at træne på det, så sender de en model rundt, der bliver trænet på folks telefoner.

Få individuel rådgivning om den bedste løsning

Hvis I ønsker at anvende personfølsomme data på en sikker måde, rådgiver vi gerne om, hvilken teknisk løsning der er den rigtige til jeres behov. Vi kan også hjælpe med at tjekke, om jeres eksisterende løsninger fungerer, som de skal.

Tag fat i Jonas Lindstrøm fra vores Security Lab

Senior Security Architect, PhD
+45 51 72 89 30
Åbogade 34, 8200 Aarhus N
Hopper bygningen, 2. etage lokale 222
.