Kunstig intelligens
Seks argumenter for en dansk sprogmodel
De fleste kender ChatGPT, der er en af de sprogmodeller, som primært er trænet på store sprog som engelsk. Men de store systemer har også en slagside, som gør, at de er underlagt andre værdisæt og regulering. Derfor giver det mening at udvikle danske sprogmodeller, som kan sikre transparens og lægge et trygt fundament for, at der er styr på alle de data, der bliver lagt i modellen.
Sådan lyder det fra Jens Kaas Benner, som er vores Head of AI Lab. Vi deltager i udviklingen af en dansk sprogmodel, som hedder Munin, i et samarbejde mellem Aarhus Universitet, Syddansk Universitet og Københavns Universitet. Den er opkaldt efter den ene af Odins ravne, Munin, der fløj ud i verden og samlede viden. Jens kommer her med seks argumenter for, hvorfor vi skal udvikle en dansk sprogmodel.
Det første argument er, at der findes enormt meget følsomt data, som det er problematisk at lægge i en cloud-løsning, man reelt ikke ved, hvor er henne. Det gælder fx sundheds- og patientdata. Her vil en dansk sprogmodel gøre det muligt at anvende den på use cases, hvor dataene er følsomme.
Et andet argument er, at man gør sig uafhængig af amerikanske tech-giganter og dermed undgår vendor lock-in, som betyder, at når man først er inde i deres løsning, så kan det være svært at komme ud igen.
Et tredje argument er fuld kontrol og transparens. Som demokratisk samfund ønsker vi kontrol over, hvilke data, kultur og sprog vi propper i en model, og vi ønsker også at vide, hvilken bias der kan være i modellerne.
Et fjerde argument er, at en dansk sprogmodel, alt andet lige, vil performe bedre på specifikke use cases sammenlignet med de generelle modeller. Når man kommer tæt nok på de store modeller, vil man opleve, at de ‘fumler’ lidt med det danske sprog.
Et femte argument er effektivitet og ikke mindst CO2. Hvis man laver en dansk model, vil den blive langt mindre end de gigantiske amerikanske modeller, og det vil resultere i øget omkostnings- og CO2-effektivitet i forhold til udvikling, drift og vedligeholdelse.
Det sidste argument er mere teknisk. Det er det, man kalder latency, der forklarer, hvor hurtigt man kan få modellen til at svare. Her er fordelen med en mindre og lokal sprogmodel, at den reducerer svartiderne, hvilket åbner op for use cases, hvor latency er afgørende.
Modellen er udviklet på den hurtigste af de ni supercomputere, som EU har udviklet. Den hedder LUMI og står i Finland. Rent teknisk har man taget den model, der hedder Mistral, og trænet den på et lille dansk datasæt, der hedder Danish Gigaword. Det har man gjort for at komme i gang og for at have kontrol over teknologien.
Målet er at understøtte en udvikling, hvor man har en sprogmodel, der er transparent, overholder lovgivning, hvor der er styr på alle data, og hvor organisationer og virksomheder kan specialisere sig i et forretningsområde, som giver værdi.