
computer vision
Kan man lære at estimere et objekts orientering uden dataannotering?

- april 4, 2022

Oliver Gyldenberg Hjermitslev
Visual Computing Specialist


Robust neuralt netværk
Ovenfor ses tre eksempler på genereret data. Billederne, og modellen, bliver genereret med tilfældige farver, baggrunde og støj. Dette fører til et enormt robust neuralt netværk, som kan genkende modellen og dens orientering på trods af rod i billedet og objektets farve og slid. Den tilsvarende 3-dimensionelle repræsentation bliver brugt til at lære det neurale netværk at associere knudepunkter på boremaskinen med specifikke lærte områder, den kan genkende. På denne måde kan et 2-dimensionelt billede overføres til 3D.
En beskrivelse af hele systemet (datagenerering, annotering, træning af neuralt netværk og projicering af 3D-objektet ind i et 2D-billede) kan læses i denne blogpost. Her diskuterer jeg også syntetisk data og potentielle faldgruber. Syntetisk data rummer et stort potentiale for at sænke tærsklen for brugen af deep learning og neurale netværk, specielt for små og mellemstore virksomheder.
"Syntetisk data rummer et stort potentiale for at sænke tærsklen for brugen af deep learning og neurale netværk, specielt for små og mellemstore virksomheder. "
Oliver Gyldenberg Hjermitslev Tweet
Kun fantasien sætter grænser for brugen af denne teknologi. Deltag gerne i diskussionen og send forespørgsler til mig på oliver.gyldenberg@alexandra.dk.
bliv klogere på tech
Relateret viden

DETR: Objektgenkendelse med transformere
Facebook har for nyligt udviklet DETR, et objektgenkendelsesnetværk baseret på en deep learning-algoritme kendt som ‘transformer’. DETR, som står for DEtection TRansformer, er et skridt i den rigtige retning, idet det reducerer mængden af domænekendskab, udvikleren skal have. Det simplificerer resultaterne og beregningsprocessen, og præsenterer et stærkt resultat i både hastighed og præcision.

Forklaringer som vejen til bedre modeller
Når vi taler om forklarlig kunstig intelligens, så er omdrejningspunktet tit, hvordan vi får forklaret computerens beslutningsproces, så alle kan forstå det. Det er dog ikke kun i teknologiens møde med slutbrugeren, at forklaringer har værdi. Når vi udvikler ny teknologi, kan forklaringer illustrere, hvordan en model vægter data i sin beslutning, og herunder hvad der måske vægtes uhensigtsmæssigt. Den information kan så bruges til at justere sammensætningen af den data, vi træner på og selve træningsprocessen, så vi kan forbedre vores model.