Dansk taleteknologi

CoRal er færdigudviklet, men samtalen er kun lige begyndt: Nu omfavner erhvervslivet dansk AI 

Alexandra Instituttet har sammen med en række stærke partnere skabt CoRal, hele Danmarks tale-til-tekst model. Nu er projektet slut, men tilbage står en digital infrastruktur, der udfordrer de globale tech-giganters monopol på dansk taleteknologi og understøtter danske virksomheder. 

Efter to og et halvt års intensivt arbejde med at indsamle stemmer og dialekter fra mere end 1.000 danskere er Grand Solutions-projektet CoRal (Danish Conversational and Read-aloud Speech Dataset) officielt afsluttet.  

Det har resulteret i et taledatasæt på 750 timers dansk tale og 160 timers transskriberede samtaler, som slår alle andre modeller i at genkende dansk tale. Samt en talesyntesemodel til automatisk oplæsning. 

Nu begynder implementeringen i dansk erhvervsliv, og efterspørgslen er mærkbar. Modellen blev downloadet over 150 gange i løbet af de første par dage efter CoRals afslutningskonference i februar.  
 


Det danske sprog under pres fra AI 

Lad os lige spole tilbage til dengang CoRal-projektet startede. Her stod dansk taleteknologi med en kritisk udfordring. De eksisterende modeller var primært trænet på rigsdansk. De forstod allerbedst københavnske mænd og sjældent andre dialekter. For Alexandra Instituttet har målet med CoRal derfor været dybt demokratisk. 

“Taleteknologi er i rivende udvikling. Men dansk er et lavressourcesprog, og derfor bliver der ikke investeret tungt i taleløsninger, der fungerer på dansk. Der var behov for, at vi udviklede et datasæt i høj kvalitet, der repræsenterer et større udsnit af danskernes etnicitet, dialekter og køn,” siger Sif Bernstorff Lehmann, Senior Anthropologist hos Alexandra Instituttet. 

Resultatet er et robust fundament baseret på danske stemmer fra 1.110 mennesker i alderen 11 til 97 år over hele Danmark. Mens CoRal er navnet på datasættet, har projektet også født den danske talegenkendelsesmodel RØST. Begge ligger frit tilgængelige. 

Succesen skyldes ikke mindst det brede konsortium bag projektet. Partnere som Københavns Universitet, Digitaliseringsstyrelsen og teknologivirksomhederne Alvenir og Corti har sikret, at datasættet er testet i alt fra komplicerede sundhedssamtaler til finansiel rådgivning. 

Erhvervslivet tager imod teknologien 

En af de virksomheder, der mærker værdien af CoRal på daglig basis, er ATP. Her benytter de en journalnotat-assistent, der automatisk transskriberer sagsbehandleres samtaler. ATP har historisk brugt de store udenlandske sprogmodeller til transskribering. I dag kan de bruge CoRal som et uafhængigt benchmark-værktøj, der kan evaluere, hvor godt sprogmodellerne fungerer på dansk. 

“Vi bruger CoRal til at finde ud af, hvilke af de største modeller, der performer bedst på dansk. Det giver os en mulighed for at dække den sproglige variation, som nogle modeller overser. Jeg tror CoRal har et virkelig stort potentiale for de mange virksomheder, der vil forbedre deres danske kundeservice med AI,” fortæller Christine Thier, Data Scientist hos ATP. 

Også hos virksomheden Dictus, der har arbejdet med taleteknologi i 20 år, ses CoRal som et vigtigt og positivt initiativ for udviklingen af dansk talegenkendelse.  

“Det er værdifuldt, at der bliver skabt mere dansk sprogdata i stor skala, og det kan på sigt få stor betydning for hele branchen. Initiativer som CoRal er med til at styrke dansk talegenkendelse i blandt andet sundhedssektoren, hvor dialekter og dansk som andetsprog stadig er en udfordring,” siger Jens Otto Kjærum, CEO hos Dictus 

Fremtiden er open source 

Selvom CoRal nu formelt er slut, lever ambitionerne videre. Forhåbningen er nu, at de netværk, CoRal har skabt, vil skubbe til flere tiltag, der kan videreudvikle dansk taleteknologi. 

”Vores håb er, at flere laver taleteknologi, som er open source. På den måde kan hele økosystemet understøtte hinanden, så alle bliver bedre,” afslutter Sif Bernstorff Lehmann. 

Er du nysgerrig på at vide mere?

Find datasættet, Røst-modellen og læs mere om resultaterne her 

Del dette:

Formular indsendt!