Kunstig intelligens
Skandinaviens tabere inden for sprogteknologi
Danske organisationer er i fuld gang med at implementere kunstig intelligens, der allerede nu skaber monetære resultater – det gælder fra kommercielle chatbots til offentlig dokumentation. Af samme grund er mange naturligvis nysgerrige på at høre, hvad vi kan forvente os af AI i fremtiden. Men når jeg kigger ind i fremtiden inden for kunstig intelligens, rammes jeg både af eufori og bekymring, fortæller Jens Kaas Benner, som er vores Head of AI and Data Analytics Lab.
Visionen for fremtidens AI er nemlig både opløftende og nedslående: Det er opløftende at bevidne, hvordan AI i øjeblikket i hæsblæsende fart udvikler sig fra sci-fi-legetøj til et potent værktøj. Og det er nedslående at bevidne, hvordan denne hæsblæsende udvikling kun finder sted inden for de store sprog (læs: store markeder), som det kan betale sig at udvikle til.
Dansk er et importeret biprodukt
Udviklingen af dansk sprogteknologi drives p.t. først og fremmest af amerikanske tech-giganter, der har deres egen dagsorden. De prioriterer engelsk og mangesprogs-modeller, fordi det giver den bedste forretning. Når de bidrager til danske sprogmodeller, er det et heldigt biprodukt for os; det er aldrig hovedformålet.
Hvis vores sprog skal overleve, og det digitale er en del af dén ligning, skal vi som samfund tage stilling til, hvad vi gør for at eje vores eget sprog. Hvordan sikrer vi, at danske organisationer får adgang til danske modeller og kvalitetsdata? Og hvordan fremtidssikrer vi digital dansk sprog og kultur?
Skandinavisk offensiv – spredt dansk fægtning
I resten af Skandinavien er Norge, Sverige og Island i gang med en digital offensiv, vi burde lade os inspirere af. Ud over at vores nordiske søstersprog har deres egne modeller og datasæt, som flittigt videreudbygges og plejes, er der især tre punkter, der giver de andre skandinavers AI kant:
- Store ambitioner: De andre nordiske sprogs digitale fremtid er massivt finansieret og understøttet af både offentlige og private aktører. Omfanget af støtten gør det muligt at lægge et ambitionsniveau for dagen, vi kun kan drømme om.
- Skandinavisk samfundssind: De datasæt og modeller, der udvikles til de andre nordiske sprog, bliver som hovedregel stillet gratis til rådighed for offentligheden – også når det er private virksomheder, der udvikler modellerne og datasættene.
- Sproglig infrastruktur: Digitaliseringen af nationalsproget betragtes som en kritisk samfundsopgave. Derfor bliver opgaven med at træne algoritmer og vedligeholde og berige datasæt ikke overladt til tilfældige aktørers tilfældige indsatser.
Det modsatte er tilfældet i Danmark, hvor vi netop overlader udviklingen til tilfældighederne og en masse isolerede tiltag.
AI forbeholdt store organisationer
Men går det ikke meget godt alligevel? Det kommer an på, hvem man spørger. I Alexandra Instituttet har vi for DR udviklet en algoritme, der kan genkende stødende tale og hjælpe moderatorer på sociale medier. Og for ATP er vi ved at undersøge, om vi kan lære en maskine at dokumentere selskabets telefonsamtaler med borgerne.
Både DR og ATP er store organisationer i dansk sammenhæng, og for dem kan det godt betale sig at arbejde med AI. Men for langt de fleste danske virksomheder vil investeringen ikke kunne svare sig. De danske start-ups, der udvikler AI og kunne løse problemet, har en langt bedre business case, hvis de udvikler engelsksproget AI og dropper dansk.
Dansk betaler sig kun for danskerne
Fordi vi er et lille sprogområde og dermed en dårlig forretning, er vi nødt til at løfte opgaven sammen. Danmark har brug for en storstilet indsats, der forener alle relevante aktører. Sammen skal vi træne algoritmer og kuratere, vedligeholde og berige data. Den viden skal ikke være privat ejendom; vi skal sikre, at alle har adgang, både organisationer og borgere.
Som Godkendt Teknologisk Service-institut specialiseret i it står vi gerne i spidsen for en koordineret indsats på nationalt plan. Det er allerede nu muligt at bidrage til at fremtidssikre dansk sprog og kulturarv digitalt og følge udviklingen blandt andet gennem vores Github-side. På den måde kan dansk blive en god business case for os alle sammen.
Dette debatindlæg blev publiceret i Datatech den 22. november 2023. Vi siger tak til Datatech, der har givet os lov til at publicere indlægget her.