Kom med i Dansk Sprogmodel Konsortium
Vil I være med til at sætte skub i udviklingen af ansvarlige, danske sprogmodeller?
Dansk Sprogmodel Konsortium er et værdibaseret fællesskab, der er åbent for alle, der kan tilslutte sig dets formål og principper*. Medlemmerne vil sikre transparens og ophavsrettigheder til danske data, så sprogmodellerne trygt kan anvendes. I dag gør mange allerede brug af sprogmodeller, der dog ofte primært er trænet på store sprog som engelsk. De modeller kan derudover være underlagt andre værdisæt og anden regulering.
Bliv en del af konsortiet
Det arbejder vi for i Dansk Sprogmodel Konsortium
Fælles, gratis og ansvarlige AI-baserede sprogmodeller på dansk vil blive et nationalt aktiv og sikre den fortsatte digitale udvikling af Danmark.
Konsortiets rolle er at bidrage med danske data og use-cases. Udviklingen af grundmodellerne sker i regi af Danish Foundation Models, der er et samarbejde mellem Aarhus Universitet, Københavns Universitet, Syddansk Universitet og Alexandra Instituttet.
Læs mere om konsortiet og se, hvem der allerede har meldt sig ind her.
Vi samarbejder fra ATPs side meget gerne om at få flere sprogmodeller at vælge imellem. En dansk sprogmodel vil kunne give både transparens omkring træningsdata og samtidig beskytte vores egne data ved at basere modellen på regulerede datakilder. Derudover kan danske sprogmodeller blive et nationalt aktiv, der er tilgængeligt for alle både kommercielle og ikke-kommercielle aktører, så vi kan accelerere den digitale udvikling i Danmark.
Koncerndirektør Anne Kristine Axelsson, ATP
Formål og principper
PRINCIPPER
DFM vil udvikle danske sprogmodeller og forpligter sig til at udvikle dem med afsæt i følgende principper:
1. Åbne og gratis: De udviklede danske sprogmodeller skal være open source og derfor til enhver tid være fri og gratis tilgængelige for alle, og de kan anvendes kommercielt.
2. Overholde lovgivning: De anvendte data og udviklede sprogmodeller skal til enhver tid overholde dansk lov og EU-lovgivning, herunder GDPR og AI Act.
3. Data: Modellerne skal trænes på datasæt, som er godkendt til formålet af opretshaverne. Data skal filtreres for personinformation, inden de må bruges til træning af modellerne. Data må ikke forlade EU.
4. Transparens og etik: Der skal være transparens i forhold til datakilder og modeltræning, samt sikkerhed for at danske værdier og etik er indarbejdet.
5. Sikkerhed: Der implementeres robuste sikkerhedsprotokoller, der beskytter data og modellerne mod potentielle sårbarheder, samt sikrer, at data kun anvendes til udvikling af danske sprogmodeller.
FORPLIGTELSE
Medlemmer af Dansk Sprogmodel Konsortium forpligter sig til:
1. Offentlighed: At promovere initiativet og indvilge i at offentliggøre deres deltagelse.
2. Use-cases: At dele deres relevante use-cases i Konsortiet med henblik på modellens fortsatte udvikling. Derudover opfordres medlemmerne til at dele use-cases i offentligheden for at inspirere til udbredelse af modellernes anvendelse.
3. Dataadgang: At dele datasæt løbende med DFM, som kan anvendes til at træne danske modeller på.
4. Tilslutning til pricipper: At erklære sig enige i, at principperne for udvikling af de danske sprogmodeller også er fundamentet for en ansvarlig implementering og anvendelse af kunstig intelligens.
Har du spørgsmål?
Kontakt
Torben Blach
Senior projektleder
Alexandra Instituttet, AI Lab
Tlf.: +45 91 55 87 99
Email: torben.blach@alexandra.dk