25. september 2025

Sådan lærer AI’en at skrive stuerent

Kom til webinar og hør, hvordan vores AI Specialist Kristian Nørgaard Jensen renser danske tekstdata for reklamer, porno og anden støj, så vi kan skabe en dansk sprogmodel, der skriver lødige tekster af høj kvalitet. På webinaret viser han det nye værktøj, han har udviklet, som kan måle kvaliteten på en tekst, og som I kan bruge, når I går i gang med AI.

Om webinaret

Lær af Kristians erfaringer med at skabe stuerene træningsdata

Vi ved ikke, hvilke data de store, gængse sprogmodeller er trænet på. Men vi ved, at de ikke altid taler sandt, og at nogle af dem censurerer deres svar.

For at skabe en dansk sprogmodel, der er uafhængig af udenlandske techgiganter og forstår dansk sprog og kultur, er vores AI Specialist Kristian Nørgaard Jensen i gang med at indsamle bunkevis af dansk tekstdata fra Internettet.

Problemet er bare, at der er ualmindelig meget dårlig dansk tekst: Rigtig meget af den er slet ikke rigtigt dansk, men bare elendige maskinoversættelser af engelsksprogede reklamer og porno. Derfor har Kristian udviklet et værktøj, der kan måle tekstkvalitet, og et kvalitetsdatasæt, man kan træne danske sprogmodeller på. 

I dette webinar deler Kristian ud af sine erfaringer fra projektet:

  • Hvordan laver man et træningsdatasæt af høj kvalitet? Kristian fortæller om hele præprocesseringen af data, dvs. håndtering, sortering, rensning, og forberedelse af et datasæt, man kan træne modeller på.
  • Tilblivelsen af måleværktøjet: Hvordan kan man måle tekstkvaliteten på dansk? Hvilke metoder er vi blevet inspireret af? Hvordan har vi tilpasset udenlandske metoder, så det passer til det danske sprog?

Målgruppe

Hvem kan deltage?

Webinaret er for dig, der selv udvikler LLM-baserede teknologier eller arbejder i en organisation, der skal til at udvikle eller implementere AI-løsninger med tekst.

Det er ikke vigtigt, om du er AI-ekspert eller bare AI-interesseret – du får helt sikkert udbytte af Kristians erfaringer og et blik ind i AI-maskinrummet i Alexandra Instituttet.

Udbytte

Det får du med hjem

Webinaret giver dig:

  • Indsigt i, hvordan tekstdatasæt bliver indsamlet, håndteret, processeret, sorteret, renset og gjort til et færdigt datasæt, som man kan træne sprogmodeller på, så de virker efter hensigten og selv bliver i stand til at generere kvalitetstekst.
  • Helt ny viden om, hvordan vi har lavet et værktøj, der kan måle, hvor høj kvaliteten af en dansk tekst er. Kristian viser dig, hvilke aspekter vi måler på, og hvordan vi vurderer de forskellige egenskaber af en tekst, så du selv kan komme i gang med at måle og sortere jeres tekster.

kontakt

Har du spørgsmål, er du velkommen til at kontakte:

Kristian Nørgaard Jensen
AI Specialist

+45 20 95 28 62
kristian.n.jensen@alexandra.dk

Andre events

Måske kunne disse events også have din interesse:

Arrangement

Security by Design Tools

30 JUNE 2025 · ONLINE
In this webinar, we will share practical tools and methods for integrating security into your development processes from the outset. The webinar is organised in collaboration with Odense Robotics.

Læs mere »
Arrangement

LDS workshop on Speech Recognition Solutions

1 JULY 2025 · ONLINE
This webinar brings together leading experts from across EU member states to explore challenges and opportunities surrounding Automatic Speech Recognition solutions. Torben Blach from the Alexandra Institute will share insights from a Danish perspective.

Læs mere »
Arrangement

IoT-cybersikkerhed i praksis

START: 19. AUGUST 2025 · AARHUS
På dette kursus bliver I trænet i at anvende de nyeste sikkerhedsværktøjer i jeres egen virksomhed, så I kan arbejde strategisk med IoT-cybersikkerhed. Det er gratis at deltage.

Læs mere »

Andre events

Måske kunne disse events også have din interesse:

Arrangement

Security by Design Tools

30 JUNE 2025 · ONLINE
In this webinar, we will share practical tools and methods for integrating security into your development processes from the outset. The webinar is organised in collaboration with Odense Robotics.

Læs mere »
Arrangement

LDS workshop on Speech Recognition Solutions

1 JULY 2025 · ONLINE
This webinar brings together leading experts from across EU member states to explore challenges and opportunities surrounding Automatic Speech Recognition solutions. Torben Blach from the Alexandra Institute will share insights from a Danish perspective.

Læs mere »
Arrangement

IoT-cybersikkerhed i praksis

START: 19. AUGUST 2025 · AARHUS
På dette kursus bliver I trænet i at anvende de nyeste sikkerhedsværktøjer i jeres egen virksomhed, så I kan arbejde strategisk med IoT-cybersikkerhed. Det er gratis at deltage.

Læs mere »

Formular indsendt!