Kunstig intelligens
1.500 timers tale skudt i gang af minister
Digitaliserings- og ligestillingsminister Marie Bjerre var med, da vi fik de første stemmeoptagelser i hus i Aalborg d. 19. juni. Over de næste to år optager vi 1.500 timers taledata med bred repræsentation af danske dialekter og accenter.
Innovationsfonden og en række partnere står med os i projektet med navnet CoRal. Formålet er at gøre det lettere for både virksomheder og det offentlige at videreudvikle eksisterende løsninger og at udbrede brugen af taleteknologi til nye områder og brancher, hvor det ikke bruges i dag. Hun udtaler til DR:
Vi kommer til at se i fremtiden, at vi får mere sprogteknologi, hvor man eksempelvis spørger teknologien om noget. Her er det vigtigt, at teknologien også forstår de danskere, der taler med dialekt, så de selvfølgelig også kan bruge teknologien.
Det er også en måde at passe på det danske sprog og vores dialekter, som er en vigtig del af vores kultur”.
Marie Bjerre, Digitaliserings- og ligestillingsminister
Brug for data
Der er stor forskel på tilgængeligheden af taledata på dansk og store sprog som engelsk. Kunstig intelligens og taleteknologi skal bruge data for at blive brugbar, og derfor er vi i udgangspunktet væsentligt ringere stillet i Danmark end i mange af de lande, vi ellers sammenligner os med, da vi er så få. Samtidig er det omkostningsfuldt at producere data.
– Derfor indsamler projektet taledata rundt i hele landet. Vi træner løbende sprogmodeller på datasættet, fx forskellige tale-til-tekst og tekst-til-tale modeller, for at teste datasættets kvalitet på forskellige dialekter, så vi kan samle mest af det, hvor udfordringerne er størst, forklarer Kasper Fænø Bay Noer fra Alexandra Instituttet, der er projektleder på CoRal.
Store perspektiver
Anders Jess Pedersen er en af senior AI-udviklerne bag projektet. Han forklarer perspektiverne specielt i sundhedsvæsenet til DR TV-Avisen, der fulgte dagens første optagelser tæt. Perspektiverne kræver, at AI-modellerne, der ligger bag, kan forstå et bredt spektrum af accenter. Noget som også kan optimere hjælpemidler, som bruges af eksempelvis borgere med nedsat syn eller støtte SOSU-medarbejderen i sit arbejde.
Du kan læse mere i DR’s artikel:
Godaw’ do: Nu skal danske dialekter samles i en digital bank
Eller på TV Syd:
Synnerjysk og wæstjysk og alle andre dialekter i Danmark skal gemmes
Gå også gerne til alexandra.dk/coral, hvor du kan se baggrunden og tilmelde dig som ”stemmedonor”.