Alexandra Instituttet A/S // Aktuelt // Nyheder // Nyheder 2019 // Alexandra Instituttet indgår samarbejde med DR og Infomedia om udvikling af dansk sprogteknologi

Alexandra Instituttet indgår samarbejde med DR og Infomedia om udvikling af dansk sprogteknologi

Artikel

08-10-2019

Alexandra Instituttet indgår samarbejde med DR og Infomedia om udvikling af dansk sprogteknologi

For at vi kan få god dansk sprogteknologi, skal vi lære computere dansk. Til det formål har vi brug for rigtig meget dansk tekst. Derfor har vi indgået et samarbejde med DR og Infomedia, så vi kan træne computerne på danske artikler og debatindlæg. 

Med afsæt i danske tekster fra DR og Infomedia er vi i gang med at udvikle modeller, der fx kan gøre chatbots nemmere at kommunikere med, og som med stor præcision kan skabe overblik over trends i holdningsytringer i store mængder af data fra sociale medier. 

Ifølge Infomedias Head of Technology, Claus Lindquist Henriksen, er arbejdet med at udvikle dansk sprogteknologi en vigtig mission:

– Vi analyserer tæt på 50.000 danske tekster hver dag, og udviklingen af dansk sprogteknologi er afgørende for, at vi fortsat kan levere relevante indsigter i stadigt stigende mængder af data. Det danske sprog er meget småt i en global kontekst, og hvis vi skal kunne måle os med internationale tech-giganter inden for AI, må vi samle viden, data og teknologi i et projekt som det her. AI skal ikke kun være forbeholdt de internationale tech-giganter men også danske virksomheder med globale ambitioner, siger Claus Lindquist Henriksen.

Udnyt teknologiens muligheder på dansk

Vi møder allerede sprogteknologi mange steder i vores hverdag. Når din mail selv frasorterer spam-mails, eller din mobil foreslår det næste ord, når du er ved at skrive en besked. Men teknologierne er primært udviklet på engelsk, mens dansk som et lille sprogområde ikke har fået opmærksomhed fra de tech-giganter, der er længst fremme med sprogteknologierne.

Gennem dette samarbejde udvikler vi dansk sprogteknologi, så både det private og det offentlige kan udnytte fordelene ved at bruge teknologierne.

Med afsæt i danske tekster fra DR og Infomedia udvikler Alexandra Instituttets AI-eksperter modeller, der fx kan gøre chatbots nemmere at kommunikere med, kan skabe overblik over trends i holdningsytringer i store mængder af data fra sociale medier og kan finde personer i en tekst med stor præcision.

Sidstnævnte vil blandt andet kunne bruges til at forbedre søgninger efter personer i tekster, fordi vi med modellen ikke bare leder efter et navn, men også efter hvordan en person typisk optræder grammatisk i en tekst. Systemet vil på den måde kunne styre udenom typiske tvetydige navne som 'Hans', 'Ane' eller 'Sten', som også er udsagns- eller navneord. Det kan fx også bruges til nemt at finde og sløre navne i en tekst, fx i forhold til GDPR.

– I DR ligger vi i sagens natur inde med meget dansksproget tekst, hvorfor vi er glade for et projekt som dette. Til dels fordi det kan hjælpe os i forståelsen af store tekstmængder, men også fordi det for DR er vigtigt at være en del af videnudviklingen i samfundet, hvor vi i samarbejde med andre udvikler vores forståelse af vigtige emner, siger Cæcilie Bach Kjærulf, Medieforsker i DR.

Dette projekt kan potentielt give et skub til de digitale teknologier på dansk, hvilket kan være nyttigt for en lang række virksomheder, offentlige institutioner og andre interessenter, som vil arbejde med machine learning, AI og lignende – på dansk.

Vigtigt samarbejde

Det er rigtig vigtigt for projektets mission, at både DR og Infomedia har valgt at takke ja til samarbejdet.

– Det er så vigtigt, at vi i vores arbejde har store mængder god, dansk tekst. Både så vi i Danmark kan bruge teknologierne til at forbedre vores indbyrdes kommunikation, og så vi kan bevare dansk som sprogområde med alle vores særegne kendetegn som fx ironi. Der ligger meget mellem linjerne i sproget, og det er ikke en nem nød at knække at sætte det på formel, forklarer Anne Bøgh Fangel. Hun er projektleder på Dansk for Alle-projektet i Alexandra Instituttet. 

Ifølge Anne Bøgh Fangel er det en vigtig nød at knække. For hvis computeren tager alt bogstaveligt, så vil den misse de kulturelle koder i sproget, og så bliver kommunikationen ikke god nok.

Profilbillede af Anne Bøgh Fangel
Manager – Technologies in Practice
Principal Organisation Analyst
+45 22 25 53 22
Åbogade 34, 8200 Aarhus N
Hopper bygningen, 3. etage lokale 332

Følg med i arbejdet

Vi gør en dyd ud af at bruge åbne metoder og lægge vores modeller frem, så I kan få glæde af dem! Der er flere måder at følge med i vores arbejde på...

  • Start med vores hjemmeside danlp.alexandra.dk, hvor vi giver en introduktion til vores arbejde og NLP – natural language processing – og guider dig hen til den del af vores arbejde, du får mest ud af at kigge videre på. 
     
  • For en lidt dybere indføring i sprogteknologiens verden skal du hoppe til vores blog, hvor vi løbende skriver om udviklingen af sprogteknologierne – og de muligheder og udfordringer vi støder på undervejs.
     
  • Og er du klar til at bruge sprogteknologi i dit arbejde, så er det værd at kigge nærmere på vores Github, hvor vi lægger vores modeller ud til fri afbenyttelse. De første er allerede klar – og vi vil rigtig gerne høre, hvad du synes om dem, når du har afprøvet dem. 

Hvis dansk sprogteknologi skal blive godt, skal vi arbejde sammen – så tak for at følge med!

.