Computer vision

DETR: Objektgenkendelse med transformere

Facebook har for nyligt udviklet DETR, et objektgenkendelsesnetværk baseret på en deep learning-algoritme kendt som ‘transformer’. DETR, som står for DEtection TRansformer, er et skridt i den rigtige retning, idet det reducerer mængden af domænekendskab, udvikleren skal have. Det simplificerer resultaterne og beregningsprocessen, og præsenterer et stærkt resultat i både hastighed og præcision.

Kan man lære at estimere et objekts orientering uden dataannotering?

For at estimere et givent objekts orientering i forhold til et kamera skal man først og fremmest kende, og genkende, objektets form og størrelse. Neurale netværk klarer disse opgaver godt, da de med nok data kan lære abstrakte koncepter. Dog er dataannotering, specielt til at estimere orientering og position, en lang, tidskrævende proces. Derfor har vi udviklet en motor til at generere syntetisk data til netop denne slags opgaver. Resultatet kan ses nedenfor.

Formular indsendt!