Taleteknologi

Vi skal i gang med at udvikle og forbedre dansk taleteknologi, så teknologien kan bruges af alle, der taler dansk – også dem, der taler dialekt eller med accent. Det skal vi bl.a. gøre ved at optage timevis af talt og oplæst dansk og ved at udvikle danske sprogdatasæt og sprogmodeller.

Taleteknologi bruges til at forstå og gengive talt sprog og bliver bl.a. brugt til at hjælpe og aflaste:

  • Stemmestyrede hjælpemidler til f.eks. ældre, borgere med synshandicap eller særlige behov
  • Diktat af sundhedsjournaler eller automatisk dokumentation af samtaler med borgere eller kunder
  • Voice- og chatbots til f.eks. it-hjælp som nulstilling af passwords, navigation på hjemmesider, etc.
  • Bedre maskinoversættelse mellem dansk og andre sprog
  • Bedre digital oplæsning i f.eks. GPS eller i offentlig transport
  • Beslutningsstøtte med relevant viden til medarbejdere

Problemet

Problemet: Dansk taleteknologi halter bagude

I øjeblikket har dansk taleteknologi svært ved at forstå kvinder, ældre, dialekter og accenter. Og for at taleteknologi kan bruges i for eksempel voicebots og stemmestyrede hjælpemidler, er det nødvendigt, at det virker for alle borgere.

 

Samtidig er det danske sprog for lille et marked til, at private virksomheder alene kan drive udviklingen af teknologien.

 

Løsningen

Løsningen: Vi vil gøre taleteknologi tilgængelig for alle

Innovationsfonden har bevilget 14 mio. kroner til et projekt, der skal bringe dansk taleteknologi op på internationalt niveau. I løbet af de næste to år skal vi udvikle et taledatasæt med navnet CoRal, der står for Danish Conversational and read-aloud speech dataset.

 

Datasættet skal indeholde 1000-1500 timers samtale og oplæst tale fra et bredt og repræsentativt udsnit af befolkningen i forhold til køn, alder, danske dialekter og udenlandske accenter. Samtidig skal der udvikles sprogmodeller, der kan genkende dansk tale og læse dansk tekst højt.


Alle data og modeller bliver testet og offentliggjort løbende, så udviklere, virksomheder og offentlige institutioner kan drage nytte af dem fra start.

vi søger indtalere

Vil du gøre vores taleteknologi god til at forstå dig?

Vi fra Alexandra Instituttet vil gerne rekruttere talere fra hele landet. Vi opfordrer dig især til at melde dig som indtaler, hvis du er kvinde, ældre eller taler med accent eller dialekt.

 

Hvis du vil være med som indtaler eller vil vide mere om projektet, så kontakt Kasper Fænø Bay Noer, der er Senior Digital Strategist her på Alexandra Instituttet:

Tlf. 26 83 80 44 kasper.noer@alexandra.dk.


V
i kontakter dig med yderligere info når vi starter optagelser.

Fakta om projektet

Officiel titel: Danish Conversational and read-aloud speech dataset (CoRal)

Varighed: 2 år og 10 måneder

 

Innovationsfondens investering: 14.217.380 mio. kr.

Samlet budget: 22.172.400 mio. kr.

Om partnerne

Alexandra Instituttet er Danmarks eneste Godkendte Teknologiske Service-institut specialiseret i IT og digitalisering. Instituttet er sat i verden for at sikre, at de nyeste digitale teknologier bliver gjort tilgængelige for dansk erhvervsliv og det danske samfund som helhed.

Alvenir er en dansk spin-out virksomhed fra DTU som arbejder domænespecialiseret talegenkendelse til b.la. dokumentation af finansielle rådgivningssamtaler. Derudover spiller Alvenir en aktiv rolle i det danske open-source miljø, og har siden virksomhedens stiftelse bidraget med både sprogmodeller og dataresourcer.

Corti er en dansk virksomhed, der har udviklet tale-, lyd-, og tekstbaseret AI-software til at assistere patientbehandling og dokumentation i sundhedssektoren. Med den banebrydende AI-software nedbringer Corti tiden samt højner kvaliteten af den enkelte patientinteraktion. Corti’s software nærmer sig 100 millioner interaktioner om året i skandinavien og engelsktalende lande, primært USA

Datalogisk Institut på Københavns Universitet (DIKU) er Danmarks ældste og førende datalogiske institut. DIKU forsker og underviser inden for de tre hjørner af datalogi – algoritmer, mennesker og data – og instituttet deltager aktivt i udviklingen af teknologisk innovation i samfundet gennem en lang række samarbejder.

Digitaliseringsstyrelsen udformer og implementerer digitaliseringsinitiativer i den offentlige sektor. Styrelsen understøtter effektivitet og fleksible digitale services via løsninger til borgere, private virksomheder og offentlige myndigheder. For at understøtte udviklingen af danske sprogteknologiske løsninger, så har regeringen, KL og Danske Regioner udviklet sprogteknologi.dk, som skal give let adgang til danske sprogressourcer. 

Formular indsendt!