Kom med i Dansk Sprogmodel Konsortium

Vil I være med til at sætte skub i udviklingen af ansvarlige, danske sprogmodeller?

Dansk Sprogmodel Konsortium er et værdibaseret fællesskab, der er åbent for alle, der kan tilslutte sig dets formål og principper*. Medlemmerne vil sikre transparens og ophavsrettigheder til danske data, så sprogmodellerne trygt kan anvendes. I dag gør mange allerede brug af sprogmodeller, der dog ofte primært er trænet på store sprog som engelsk. De modeller kan derudover være underlagt andre værdisæt og anden regulering.

Bliv en del af konsortiet

Virksomheder der allerede er med i Dansk Sprogmodel Konsortium

  • 2021.ai
  • Aeven
  • Ante
  • ATP
  • Bagger-Sørensen
  • BUILD – Institut for Byggeri, By og Miljø, AAU
  • Cbrain
  • Cleardox
  • DK Medier
  • DLA Piper
  • EdTech Denmark
  • Falck
  • FSB
  • FSR
  • Globeteam
  • HOFOR
  • KL
  • KomBit
  • Lydmaskinen.dk
  • Magenta, opensource it
  • Makeable
  • Norlys
  • Odense Kommune
  • Plesner
  • Region Nord
  • Salling Group
  • SKI
  • Styrelsen for IT og Læring
  • TDC
  • Topdanmark
  • Vejle Kommune
  • Vertica
  • Videncenter Bolius
  • Visma Enterprise
  • Vitec
  • Aalborg Kommune
  • Aarhus Kommune

Det arbejder vi for

Fælles, gratis og ansvarlige AI-baserede sprogmodeller på dansk vil blive et nationalt aktiv og sikre den fortsatte digitale udvikling af Danmark.

Konsortiets rolle er at bidrage med danske data og use-cases. Udviklingen af grundmodellerne sker i regi af Danish Foundation Models, der er et samarbejde mellem Aarhus Universitet, Københavns Universitet, Syddansk Universitet og Alexandra Instituttet.

Formål og principper

PRINCIPPER
DFM vil udvikle danske sprogmodeller og forpligter sig til at udvikle dem med afsæt i følgende principper:
1. Åbne og gratis: De udviklede danske sprogmodeller skal være open source og derfor til enhver tid være fri og gratis tilgængelige for alle, og de kan anvendes kommercielt.
2. Overholde lovgivning: De anvendte data og udviklede sprogmodeller skal til enhver tid overholde dansk lov og EU-lovgivning, herunder GDPR og AI Act.
3. Data: Modellerne skal trænes på datasæt, som er godkendt til formålet af opretshaverne. Data skal filtreres for personinformation, inden de må bruges til træning af modellerne. Data må ikke forlade EU.
4. Transparens og etik: Der skal være transparens i forhold til datakilder og modeltræning, samt sikkerhed for at danske værdier og etik er indarbejdet.
5. Sikkerhed: Der implementeres robuste sikkerhedsprotokoller, der beskytter data og modellerne mod potentielle sårbarheder, samt sikrer, at data kun anvendes til udvikling af danske sprogmodeller.

FORPLIGTELSE
Medlemmer af Dansk Sprogmodel Konsortium forpligter sig til:
1. Offentlighed: At promovere initiativet og indvilge i at offentliggøre deres deltagelse.
2. Use-cases: At dele deres relevante use-cases i konsortiet med henblik på modellens fortsatte udvikling. Derudover opfordres medlemmerne til at dele use-cases i offentligheden for at inspirere til udbredelse af modellernes anvendelse.
3. Dataadgang: At dele datasæt løbende med DFM, som kan anvendes til at træne danske modeller på.
4. Tilslutning til principper: At erklære sig enige i, at principperne for udvikling af de danske sprogmodeller også er fundamentet for en ansvarlig implementering og anvendelse af kunstig intelligens.

Der har været en enestående bred opbakning til vores fælles ide om en alliance, der kunne sætte skub i udviklingen af ansvarlige, danske sprogmodeller, og døren står åben for, at flere ligesindede deltager. Initiativet vil med garanti sætte ny fart i digitaliseringen herhjemme, da vi kan have tillid til vores danske sprogmodeller, siger Thomas Kovsted, adm. direktør, IBM Danmark

Fælles, gratis og ansvarlige AI-baserede sprogmodeller på dansk vil blive et nationalt aktiv og sikre den fortsatte digitale udvikling af Danmark. Konsortiets rolle er at bidrage med danske data og use-cases. Udviklingen af grundmodellerne sker i regi af Danish Foundation Models, der er et samarbejde mellem Aarhus Universitet, Københavns Universitet, Syddansk Universitet og Alexandra Instituttet, siger Jens Kaas Benner, Head of AI Lab ved Alexandra Instituttet, der er én af initiativtagerne bag konsortiet.

FAQ

Spørgsmål

Vi laver danske sprogmodeller, der understøtter use-cases, hvor det giver mening i en dansk kontekst. Vi laver altså ikke en konkurrent til ChatGPT, et al.

Medlemmer af konsortiet donerer data til os, som vi træner modeller på. Hvis dataejeren ønsker det, bliver data open sourced.

Det faglige fundament og udviklingen af sprogmodeller er funderet i Danish Foundation Models, som er et samarbejde mellem Alexandra Instituttet, Københavns Universitet – University of Copenhagen (Professor Bolette Pedersen), Syddansk Universitet – University of Southern Denmark (Professor Peter Schneider-Kamp) og Aarhus University (Professor Kristoffer Nielbo) /2/.

Da danske universiteter er med i DFM, har vi adgang til ni EU-betalte supercomputere. Pt bruger vi den største af dem alle: LUMI supercomputer. EU er ved at bygge flere supercomputere, og Novo Nordisk er også i gang!

De modeller, vi træner, og størrelsen af dem afhænger af, hvor meget data vi får doneret. Til at starte med kommer vi til at basere os på eksisterende open source modeller.

Alle modeller vil blive frigivet til open source og må bruges kommercielt

Vi samarbejder fra ATPs side meget gerne om at få flere sprogmodeller at vælge imellem. En dansk sprogmodel vil kunne give både transparens omkring træningsdata og samtidig beskytte vores egne data ved at basere modellen på regulerede datakilder. Derudover kan danske sprogmodeller blive et nationalt aktiv, der er tilgængeligt for alle både kommercielle og ikke-kommercielle aktører, så vi kan accelerere den digitale udvikling i Danmark.
Koncerndirektør Anne Kristine Axelsson, ATP

Har du spørgsmål?

Kontakt

Torben Blach
Senior projektleder
Alexandra Instituttet, AI Lab

Tlf.: +45 91 55 87 99
Email: torben.blach@alexandra.dk

Formular indsendt!