Arbejdet med sprogmodeller undergår en enorm udvikling i øjeblikket og kan f.eks. give bedre transskriberingsværktøjer til offentlige og private virksomheder. Det kommer også almindelige danskere til gavn, når de f.eks. skal tale med deres mobil.
Men hvordan sikrer man, at sprogmodellerne fungerer lige så godt på dansk og andre europæiske sprog end engelsk? Det er noget af det, som Sofie Helene Bruun, der er ny AI Specialist hos Alexandra Instituttet, er med til at sikre.
Evalueringen af sprogmodellerne, som hun arbejder på i øjeblikket, foregår ved at udvikle logiske opgaver, der kan være mere udfordrende for sprogmodeller end for mennesker. Om det forklarer hun:
“F.eks. kan man sige, at man har to huse, som er beboet af Alice og Bob. Den ene har en kat, og den anden har en hund. Alice bor i det første hus, og Bob har en kat. I hvilket hus er der en hund? Den slags opgaver vil mange sprogmodeller svare forkert på. Det gælder især, når man giver personerne flere egenskaber, som de skal gætte.”
Lige nu arbejder hun på at generere store datasæt og forskellige typer af opgaver, som gør det muligt at sammenligne, hvor godt de forskellige sprogmodeller klarer sig i gennemsnit på opgaver, de ikke har set før. Derefter er planen at sammenligne, hvordan sprogmodellerne præsterer på forskellige sprog.
“Det er selvfølgelig vigtigt at have sprogmodeller, som klarer sig godt på dansk, da det er med til at sikre, at folk har adgang til de samme services, som hvis de blev kommunikeret på engelsk. Et kæmpe element er også, at man ikke er så afhængig af enkelte store sprogmodeller uden for EU. Det giver mulighed for at bruge det til nogle andre ting, når der er bedre kontrol over, hvordan de er skabt, og man ved, hvordan modellen bruger folks data.”
Sofie Helene Bruun kommer med en ph.d. i astrofysik og har tidligere været hos DARK, der er en del af Niels Bohr Institutet, hvor hun brugte maskinlæring til at klassificere lyskilder på himlen såsom stjerner og galakser. Det bragte hende bl.a. til øen La Palma, hvor hun sad to måneder og programmerede i et kontor midt på en bananmark.
Det gav en god vekselvirkning mellem teori og praksis
“Indimellem tog vi turen op til toppen af en vulkan for at observere med et af teleskoperne deroppe. Det var sjovt at prøve det praktiske med at holde sig vågen hele natten og holde øje med, at der ikke var noget, der gik galt – og så samtidig programmere værktøjerne til analyse af de natlige data.”
Hun har egentlig altid været fascineret af sprogmodeller og har også taget kurser i natural language processing, mens hun var på Niels Bohr Institutet, så på den måde er hun rigtig glad for at vende tilbage til området.
“Jeg kan godt lide at analysere en masse data, hvad enten det handler om at finde ud af, hvordan universet fungerer eller sprog fungerer. Jeg kan huske, at jeg som barn har set det gamle ELIZA-program fra 1960’erne, der var en simpel chatbot, og hvor jeg har tænkt, at man må kunne gøre det bedre. Det er jo en anden måde at modellere virkeligheden på, og det synes jeg er fascinerende.”
“Sprog er ekstremt komplekst, og det er spændende at se, hvordan man kan bygge modeller, der ikke tænker som mennesker, men alligevel kan generere menneskeligt sprog. Det er fascinerende at noget, der normalt kræver menneskelig forståelse, kan skabes på en helt ny måde.”
Ⓒ 2025 - Alexandra Instituttet A/S
CVR nr. 24 21 33 66