Kunstig intelligens

Danmark går forrest med ny hensigtserklæring: Mulighed for frikøb af data fra danske medier baner vej for ansvarlige sprogmodeller

I dag bliver de fleste AI-modeller, herunder mange af de større kendte sprogmodeller, trænet på data uden hensyntagen til copyright og dataejer.

En netop underskrevet hensigtserklæring mellem Dansk Sprogmodel Konsortium (DSK), som Alexandra Instituttet er medstifter af, og Danske Pressepublikationers Kollektive Forvaltningsorganisation (DPCMO) giver DSK mulighed for at frikøbe data til træning af danske sprogmodeller.

Det er et vigtigt første skridt for udviklingen af ansvarlige, danske sprogmodeller og det første af sin art i Europa. Hensigtserklæringen er afgørende i udviklingen af danske sprogmodeller til gavn for både den offentlige og private sektor. Den er samtidig første skridt mod at sikre adgang til data fra alle danske medier, hvilket er nødvendigt for at kunne udvikle danske sprogmodeller, der respekterer dataejers betingelser.

Ifølge digitaliseringsminister Caroline Stage Olsen bidrager erklæringen geopolitisk til at sikre Danmarks suverænitet som stat.

Digitaliseringsministeren fortæller: “Jeg er meget tilfreds med den nye hensigtserklæring. Den understreger, at vi i Danmark arbejder med kunstig intelligens og sprogmodeller på den danske måde, hvor vi går ansvarligt til værks og med en frikøbsmodel sikrer gode betingelser for dataejerne. Indhold er ikke gratis, heller ikke når det handler om at udvikle nye teknologier. Lad os vise resten af verden, at det godt kan lade sig gøre at udvikle ny teknologi, hvor dataejerne får en ret og rimelig behandling.”

Niels Husted Kjær, CEO hos Alexandra Instituttet, ser hensigtserklæringen som en milepæl for AI-udviklingen i Danmark. Alexandra Instituttet er sammen med partnerne i Danish Foundation Models førende inden for udviklingen af danske sprogmodeller.

“Selvom erklæringen ikke betyder, at data allerede er blevet frikøbt, så giver aftalen mulighed for at frikøbe data fra danske medier til Dansk Sprogmodel Konsortium. Aftalen er således en vigtig milepæl i udviklingen af danske sprogmodeller, som er baseret på data med respekt for dataejers betingelser. Det skaber et stærkt fundament for ansvarlig brug af data i AI-udviklingen,” siger Niels Husted Kjær.

Han pointerer desuden, at Danmark nu går forrest i Europa: “Med dette historiske skridt er Danmark det første land i Europa, der forsøger at etablere en sådan aftale. Det er afgørende, fordi det adresserer et væsentligt problem, nemlig at de fleste AI-modeller i dag trænes på data uden hensyntagen til rettigheder. Denne aftale sætter fokus på nødvendigheden af at respektere dataejernes ophavsret,” forklarer Niels Husted Kjær.

Erklæringen er ifølge Jens Kaas Benner, Head of AI Lab hos Alexandra Instituttet, med til at løse en helt central udfordring: “Muligheden for frikøb af data fra de danske medier er en afgørende faktor for, hvor hurtigt vi kan udvikle uafhængige, åbne, danske sprogmodeller. Vi har de kompetencer, der kræves for udvikling, og med Gefion-computeren har vi også den nødvendige beregningskraft i landet. I øjeblikket er det adgang til data, der sætter begrænsningen. En del af det problem kan løses med denne aftale,” slutter Jens Kaas Benner.

Fakta
En sprogmodel (LLM – Large Language Model) er en avanceret AI-teknologi, der forstår og genererer tekst ved hjælp af store datamængder og neurale netværk. Den bruges blandt andet til opgaver som chatbots, tekstgenerering og oversættelse.

DPCMO: Grundlagt i 2021 som en kollektiv forvaltningsorganisation for danske presseforlag. DPCMO beskytter medlemmernes rettigheder vedrørende brug af deres indhold til træning af AI-algoritmer og sikrer, at deres interesser forvaltes i den fælles interesse.

Dansk Sprogmodel Konsortium (DSK): Etableret i 2024 af IBM Danmark, Dansk Erhverv og Alexandra Instituttet i samarbejde med mere end 70 medlemmer. Konsortiet arbejder på at udvikle open source-sprogmodeller for dansk sprog med fokus på en ansvarlig og tillidsbaseret tilgang til generativ kunstig intelligens. Hvis man som virksomhed ønsker at deltage, kan man tilmelde sig her

Alexandra Instituttet står sammen med de øvrige partnere i Danish Foundation Models for det udførende arbejde med at træne og frigive danske open source-sprogmodeller. Læs mere her

Del dette:

Formular indsendt!