Alexandra Instituttet A/S // Aktuelt // Nyheder // Nyheder 2018 // Maskinlæring finder værdi i elevdata

Maskinlæring finder værdi i elevdata

Artikel

06-07-2018

Maskinlæring finder værdi i elevdata

Kan maskinlæring berige den eksisterende viden om elevfrafald på ungdomsuddannelserne og dermed skabe bedre beslutningsgrundlag?

Det har Horsens Kommune i samarbejde med Alexandra Instituttet undersøgt i et pilotprojekt, hvor man har kigget på samkøring af data på tværs af kommunen. I projektet har man undersøgt om maskinlæring kan være med til at give mere indsigt i data og dermed muliggøre bedre forudsigelser for den enkelte elev.

Analysen har tydeliggjort det, man allerede vidste i forvejen. Nemlig, at der er sammenhæng mellem en række faktorer i screening af elever. Analysen viser dog også klart, at det stiller krav til datakvaliteten. Det er vigtigt, at man registrerer data på ensartet vis, så det egner sig til at indgå i en større sammenhæng; ellers er det meget vanskeligt at få nogen indsigt – med eller uden maskinlæring.

Konkret kiggede man på, om der er sammenhæng mellem en række faktorer, herunder fravær, uddannelsesniveau samt forældrenes selvforsørgelse. Baggrunden er, at det på landsplan, og også i Horsens Kommune, er et mål, at 95 procent af en årgang skal have en videregående uddannelse. Inge Kruse Rasmussen, økonomidirektør i Horsens Kommune, fortæller:

Når vi arbejder med data i dag, så udvælger vi typisk nogle data, hvor vi tror, at der er en sammenhæng. I dette pilotprojekt ville vi se, om man kunne lave nogle forecast ved hjælp af kunstig intelligens og maskinlæring. Vi havde ikke en forventning om, at vi fandt den endelige nøgle til ungdomsuddannelses-frafaldet. Vi gik ind i pilotprojektet, fordi vi for en overskuelig investering kunne finde ud af, hvad vi kan lære af det, hvis der mangler noget.

Valget faldt på skoledata, karakterer, fravær på skoleområdet samt data fra familieområdet. I forsøget har man opnået resultater omkring dataindsigt og processen. Overordnet har projektet kvalificeret, hvad man allerede vidste om elevfrafald.

Det er blevet tydeliggjort, at der er sammenhænge mellem faktorer i screening af elever såsom: Karaktergennemsnit, fravær, forældrenes selvforsørgelsesgrad, geografi, herkomst, underretning af børnesager.

Altså, at jo mere fravær i skolen, des mere påvirker det, om man får en uddannelse. Jo dårligere karakterer en elev har, des større er chancen for, at de ikke får en uddannelse.

“Men vi finder ikke et mønster, der gør, at vi bliver skarpere på det, og hvor vi kan finde det bedre end før. Vi finder ikke et mønster, hvor vi kan sige, at når lille Peter optræder på en bestemt måde i systemet, så får han ingen uddannelse. Vi finder altså ikke noget, som vi ikke har tænkt i forvejen,” forklarer hun.

Frugtbar dialog om data

Den væsentligste årsag er, at datagrundlaget ikke er tilstrækkeligt robust. Enten var dataene ikke altid lige velegnede, eller også var tidsserierne ikke altid lange nok. Alligevel har forsøget båret frugt, da det har været en god måde at undersøge, om man har de nødvendige data til rådighed, inden man begynder at brænde større summer af.

Projektet har haft positiv betydning for videndeling på tværs af afdelinger og har givet god indsigt i, hvordan de forskellige afdelinger arbejder.

“Der har været rigtig god værdi i at få bragt de her skolefolk sammen. De har fået snakket om, hvordan man gør det her og registrerer data. Det har skubbet til dialogen om, at data er noget fælles, og de data, man registrerer på den enkelte skole, potentielt kan indgå i en større sammenhæng med maskinlæring og dataanalyse. Det skal nok komme. Det kræver bare, at man får skabt en bevidsthed i organisationen omkring betydningen af data og registrering,” forklarer Inge Kruse Rasmussen.

Start med små projekter

Som kommune er det netop en god idé at starte småt og kigge afgrænset på muligheder og begrænsninger inden et større projekt, lyder det fra Anders Kofod-Petersen, der er vicedirektør i Alexandra Instituttet og professor i kunstig intelligens.

At finde værdi i data starter typisk med en afklarende workshop, hvor man identificerer udfordringer og problemer. Derefter skal man finde ud af, hvilke data man skal bruge, hvem der ejer dem, og om man kan få adgang til dem. Anders Kofod-Petersen forklarer:

Det er vigtigt at sige, at kunstig intelligens ikke er nogen magisk tryllestav. Der ligger et stort arbejde i at finde data, rense dem og identificere problemstillinger og optræne en algoritme. Men når man er nået dertil, så ligger der stor værdi i at bruge maskinlæring til datadreven beslutningsstøtte. Her kan et lille projekt være en god indikator for, hvor det giver mening at arbejde med data, og om man eventuelt skal sætte større projekter i søen.

Deputy Director, Professor
Head of Data Science and Engineering Lab
Direktionen
+45 41 15 12 48
Njalsgade 76, 3. sal, 2300 København S

Sådan finder I værdi i data

Når man har identificeret sin tese og problemstilling, så handler det grundlæggende om at finde ud af, hvad man har af data i en kommune. Dernæst ligger der en del arbejde i at få overblik over data og finde ud af, hvad proceduren er for at få fat i de data.

Når man har fået dataene, så handler det om at forstå disse.

Samtidig skal der nedsættes en projektgruppe, hvorefter man kan begynde på datarensning og de første skridt af dataanalysen. Udfordringen med maskinlæring er, at det kræver en meget klar definition, og derfor ligger der en del arbejde i at lave en solid problemafgrænsning.

Når det er på plads, så kan man begynde at træne sin model på de data, man har fået renset, og dermed kan man identificere mønstre, som man kan bruge til datadreven beslutningsstøtte.

.