Alexandra Instituttet indgår samarbejde med DR og Infomedia om udvikling af dansk sprogteknologi

9.10.2019 10:07:01 CEST | Alexandra Instituttet | Pressemeddelelse

Del

For at vi kan få god dansk sprogteknologi, skal vi lære computere dansk. Til det formål har vi brug for rigtig meget dansk tekst. Derfor er Alexandra Instituttet indgået i et samarbejde med DR og Infomedia, så vi kan træne computerne på danske artikler og debatindlæg.

Med afsæt i danske tekster fra DR og Infomedia er Alexandra Instituttet i gang med at udvikle modeller, der f.eks. kan gøre chatbots nemmere at kommunikere med, og som med stor præcision kan skabe overblik over trends i holdningsytringer i store mængder af data fra sociale medier.

Ifølge Infomedias Head of Technology, Claus Lindquist Henriksen, er arbejdet med at udvikle dansk sprogteknologi en vigtig mission:

– Vi analyserer tæt på 50.000 danske tekster hver dag, og udviklingen af dansk sprogteknologi er afgørende for, at vi fortsat kan levere relevante indsigter i stadigt stigende mængder af data. Det danske sprog er meget småt i en global kontekst, og hvis vi skal kunne måle os med internationale tech-giganter inden for AI, må vi samle viden, data og teknologi i et projekt som det her. AI skal ikke kun være forbeholdt de internationale tech-giganter men også danske virksomheder med globale ambitioner, siger Claus Lindquist Henriksen.

Udnyt teknologiens muligheder på dansk

Vi møder allerede sprogteknologi mange steder i vores hverdag. Når din mail selv frasorterer spam-mails, eller din mobil foreslår det næste ord, når du er ved at skrive en besked. Men teknologierne er primært udviklet på engelsk, mens dansk som et lille sprogområde ikke har fået opmærksomhed fra de tech-giganter, der er længst fremme med sprogteknologierne.

Gennem dette samarbejde udvikler vi dansk sprogteknologi, så både det private og det offentlige kan udnytte fordelene ved at bruge teknologierne.

Med afsæt i danske tekster fra DR og Infomedia udvikler Alexandra Instituttets AI-eksperter modeller, der f.eks. kan gøre chatbots nemmere at kommunikere med, kan skabe overblik over trends i holdningsytringer i store mængder af data fra sociale medier og kan finde personer i en tekst med stor præcision.

Sidstnævnte vil blandt andet kunne bruges til at forbedre søgninger efter personer i tekster, fordi vi med modellen ikke bare leder efter et navn, men også efter hvordan en person typisk optræder grammatisk i en tekst. Systemet vil på den måde kunne styre udenom typiske tvetydige navne som ”Hans”, ”Ane” eller ”Sten”, som også er udsagns- eller navneord. Det kan f.eks. også bruges til nemt at finde og sløre navne i en tekst, f.eks. i forhold til GDPR.

– I DR ligger vi i sagens natur inde med meget dansksproget tekst, hvorfor vi er glade for et projekt som dette. Til dels fordi det kan hjælpe os i forståelsen af store tekstmængder, men også fordi det for DR er vigtigt at være en del af videnudviklingen i samfundet, hvor vi i samarbejde med andre udvikler vores forståelse af vigtige emner, siger Cæcilie Bach Kjærulf, medieforsker i DR.

Dette projekt kan potentielt give et skub til de digitale teknologier på dansk, hvilket kan være nyttigt for en lang række virksomheder, offentlige institutioner og andre interessenter, som vil arbejde med machine learning, AI og lignende – på dansk.

Vigtigt samarbejde

Det er rigtig vigtigt for projektets mission, at både DR og Infomedia har valgt at takke ja til samarbejdet.

– Det er så vigtigt, at vi i vores arbejde har store mængder god, dansk tekst. Både så vi i Danmark kan bruge teknologierne til at forbedre vores indbyrdes kommunikation, og så vi kan bevare dansk som sprogområde med alle vores særegne kendetegn som f.eks. ironi. Der ligger meget mellem linjerne i sproget, og det er ikke en nem nød at knække at sætte det på formel, forklarer Anne Bøgh Fangel. Hun er projektleder på Dansk for Alle-projektet i Alexandra Instituttet.

Ifølge Anne Bøgh Fangel er det en vigtig nød at knække. For hvis computeren tager alt bogstaveligt, så vil den misse de kulturelle koder i sproget, og så bliver kommunikationen ikke god nok.

FAKTA

Vi gør en dyd ud af at bruge åbne metoder og lægge vores modeller frem, så I kan få glæde af dem! Der er flere måder at følge med i vores arbejde på :

Start med vores hjemmeside danlp.alexandra.dk, hvor vi giver en introduktion til vores arbejde og NLP – natural language processing – og guider dig hen til den del af vores arbejde, du får mest ud af at kigge videre på.

For en lidt dybere indføring i sprogteknologiens verden skal du hoppe til vores blog https://medium.com/danlp, hvor vi løbende skriver om udviklingen af sprogteknologierne – og de muligheder og udfordringer vi støder på undervejs.
Og er du klar til at bruge sprogteknologi i dit arbejde, så er det værd at kigge nærmere på vores Github https://github.com/alexandrainst/danlp, hvor vi lægger vores modeller ud til fri afbenyttelse. De første er allerede klar – og vi vil rigtig gerne høre, hvad du synes om dem, når du har afprøvet dem.

Hvis dansk sprogteknologi skal blive godt, skal vi arbejde sammen – så tak for at følge med!

Nøgleord

Chatbot Dansk DR Infomedia kunstig intelligens sprog sprogteknologi

Billeder

Information om Alexandra Instituttet

Alexandra Instituttet
Åbogade 34 · Rued Langgaards Vej 7
8200 Aarhus N · 2300 København S

+45 70 27 70 12 https://alexandra.dk

100 eksperter under ét tag

Alexandra Instituttet hjælper offentlige og private virksomheder med at anvende den nyeste it-forskning og -teknologi. Vores udgangspunkt er samfundsmæssige problemstillinger og behov for at omsætte den nyeste forskning til innovative løsninger.

Hos os finder du stærke kompetencer inden for blandt andet visual computing, kunstig intelligens, IoT, cybersikkerhed, interaktionsdesign og smarte produkter.

Vi arbejder i et tværfagligt miljø og er et hold af højtkvalificerede specialister, der hurtigt kan forstå din organisations og dine brugeres problemstillinger.

Følg pressemeddelelser fra Alexandra Instituttet

Skriv dig op her, og modtag pressemeddelelser på e-mail. Indtast din e-mail, klik på abonner, og følg instruktionerne i den udsendte e-mail.

Flere pressemeddelelser fra Alexandra Instituttet

Smedievirksomhed reducerer arbejdstid med 10 procent ved digitalisering af elevatordeleproduktion13.3.2025 14:53:28 CET | Pressemeddelelse

Med en ny produktkonfigurator kan smedevirksomheden Ebbes Kleinsmedie spare op til 10 procent af deres arbejdstid ved at digitalisere opmålingen af karme til elevatordøre.

Alexandra Instituttet får ny marketing- og kommunikationschef7.2.2025 12:32:54 CET | Pressemeddelelse

Louise Hjerrild, der senest kommer fra Inspari A/S, skal styrke Alexandra Instituttets synlighed i it-branchen.

Carletti: De små skridt sætter også motiverende fodspor14.1.2025 09:48:11 CET | Pressemeddelelse

Arbejdet med ESG er for mange virksomheder en forandringsproces, som både påvirker aktiviteter og formidling. For Carletti blev deres Afkoblings-projekt med fokus på kommunikation et vigtigt trin på bæredygtighedstrappen.

Digitaliseringsministeriet bevilger samlet 30,7 millioner til ambitiøst dansk sprogmodels-projekt2.12.2024 11:00:04 CET | Pressemeddelelse

Syddansk og Aarhus Universitet har sammen med Alexandra Instituttet og Københavns Universitet modtaget samlet 30,7 millioner kroner fra Digitaliseringsministeriet til at etablere en ambitiøs R&D platform, Danish Foundation Models (DFM), til at udvikle og anvende sprogmodeller og sprogteknologi i Danmark.

Nye midler driver arbejdet med danske sprogmodeller yderligere fremad1.11.2024 10:33:28 CET | Pressemeddelelse

Aftalepartierne bag forskningsreserven er blevet enige om at afsætte 10 millioner kroner til forskning og innovation i danske sprogmodeller baseret på generativ kunstig intelligens i regi af Danish Foundation Models, der er et samarbejde mellem danske universiteter og Alexandra Instituttet.

I vores nyhedsrum kan du læse alle vores pressemeddelelser, tilgå materiale i form af billeder og dokumenter samt finde vores kontaktoplysninger.

Besøg vores nyhedsrum