Taleteknologi
Over de næste to år skal vi rundt i Danmark og optage mere end 2000 danskeres dialekter og accenter. Det skal blive til et taledatasæt på op mod 1500 timers danske taledata, der bliver frit tilgængelige for alle. Det gør vi for at understøtte danske myndigheder og virksomheder, så de kan udvikle endnu bedre taleteknologi på dansk.
Vil du hjælpe, så skriv dig op som indtaler nedenfor!
coral projektet
Taleteknologi skal udbredes til flere
Innovationsfonden har bevilget 14 mio. kroner til et projekt, der skal bringe dansk taleteknologi op på internationalt niveau. I løbet af de næste to år skal vi udvikle et taledatasæt med navnet CoRal, der står for Danish Conversational and read-aloud speech dataset.
Datasættet skal indeholde 1000-1500 timers samtale og oplæst tale fra et bredt og repræsentativt udsnit af befolkningen i forhold til køn, alder, danske dialekter og udenlandske accenter. Samtidig skal der udvikles sprogmodeller, der kan genkende dansk tale og læse dansk tekst højt.
Alle data og modeller bliver testet og offentliggjort løbende, så udviklere, virksomheder og offentlige institutioner kan drage nytte af dem fra start.
Hvad bruges taleteknologi til?
Taleteknologi bruges til at forstå og gengive talt sprog og bliver bl.a. brugt til at hjælpe og aflaste:
- Stemmestyrede hjælpemidler til f.eks. ældre, borgere med synshandicap eller særlige behov
- Diktat af sundhedsjournaler eller automatisk dokumentation af samtaler med borgere eller kunder
- Voice- og chatbots til f.eks. it-hjælp som nulstilling af passwords, navigation på hjemmesider, etc.
- Bedre maskinoversættelse mellem dansk og andre sprog
- Bedre digital oplæsning i f.eks. GPS eller i offentlig transport
- Beslutningsstøtte med relevant viden til medarbejdere
vi søger indtalere
Donér din stemme og hjælp dansk taleteknologi
Vi fra Alexandra Instituttet vil gerne rekruttere talere fra hele landet. Vi opfordrer dig især til at melde dig som indtaler, hvis du er kvinde, ældre eller taler med accent eller dialekt.
Hvis du vil være med som indtaler eller vil vide mere om projektet, så kontakt Torben Blach, der er Project Manager i Alexandra Instituttet:
Tlf. 91 55 87 99, torben.blach@alexandra.dk.
Vi kontakter dig med yderligere info, når vi starter optagelser.
Fakta om projektet
Officiel titel: Danish Conversational and read-aloud speech dataset (CoRal)
Varighed: 2 år og 10 måneder
Innovationsfondens investering: 14.217.380 mio. kr.
Samlet budget: 22.172.400 mio. kr.
Om partnerne
Alexandra Instituttet er Danmarks eneste Godkendte Teknologiske Service-institut specialiseret i IT og digitalisering. Instituttet er sat i verden for at sikre, at de nyeste digitale teknologier bliver gjort tilgængelige for dansk erhvervsliv og det danske samfund som helhed.
Alvenir er en dansk spin-out virksomhed fra DTU som arbejder domænespecialiseret talegenkendelse til b.la. dokumentation af finansielle rådgivningssamtaler. Derudover spiller Alvenir en aktiv rolle i det danske open-source miljø, og har siden virksomhedens stiftelse bidraget med både sprogmodeller og dataresourcer.
Corti er en dansk virksomhed, der har udviklet tale-, lyd-, og tekstbaseret AI-software til at assistere patientbehandling og dokumentation i sundhedssektoren. Med den banebrydende AI-software nedbringer Corti tiden samt højner kvaliteten af den enkelte patientinteraktion. Corti’s software nærmer sig 100 millioner interaktioner om året i skandinavien og engelsktalende lande, primært USA
Datalogisk Institut på Københavns Universitet (DIKU) er Danmarks ældste og førende datalogiske institut. DIKU forsker og underviser inden for de tre hjørner af datalogi – algoritmer, mennesker og data – og instituttet deltager aktivt i udviklingen af teknologisk innovation i samfundet gennem en lang række samarbejder.
Digitaliseringsstyrelsen udformer og implementerer digitaliseringsinitiativer i den offentlige sektor. Styrelsen understøtter effektivitet og fleksible digitale services via løsninger til borgere, private virksomheder og offentlige myndigheder. For at understøtte udviklingen af danske sprogteknologiske løsninger, så har regeringen, KL og Danske Regioner udviklet sprogteknologi.dk, som skal give let adgang til danske sprogressourcer.