Geometric Computer Vision Techniques for Scene Reconstruction

Des dels inicis de la Visió per Computador, la reconstrucció d’escenes ha estat un dels temes més estudiats que ha portat a una àmplia varietat de nous descobriments i aplicacions. La manipulació d’objectes, la localització i mapeig, o fins i tot la generació d’efectes visuals són diferents exemples...

Descripción completa

Detalles Bibliográficos
Autor: Riba Pi, Edgar
Tipo de recurso: tesis doctoral
Estado:Versión publicada
Fecha de publicación:2021
País:España
Institución:CBUC, CESCA
Repositorio:TDR. Tesis Doctorales en Red
OAI Identifier:oai:www.tdx.cat:10803/671624
Acceso en línea:http://hdl.handle.net/10803/671624
Access Level:acceso abierto
Palabra clave:Visió per computador
Visión por computador
Computer vision
Tecnologies
004
Descripción
Sumario:Des dels inicis de la Visió per Computador, la reconstrucció d’escenes ha estat un dels temes més estudiats que ha portat a una àmplia varietat de nous descobriments i aplicacions. La manipulació d’objectes, la localització i mapeig, o fins i tot la generació d’efectes visuals són diferents exemples d’aplicacions en les que la reconstrucció d’escenes ha pres un paper important per a indústries com la robòtica, l’automatització de fàbriques o la producció audiovisual. No obstant això, la reconstrucció d’escenes és un tema extens que es pot abordar de moltes formes diferents amb solucions ja existents que funcionen de manera efectiva en entorns controlats. Formalment, el problema de la reconstrucció d’escenes pot formular-se com una seqüència de processos independents. En aquesta tesi, analitzem algunes parts de la seqüència de reconstrucció a partir de les quals contribuïm amb nous mètodes que fan servir Convolutional Neural Networks (CNN), proposant solucions innovadores que consideren l’optimització dels mètodes de forma conjunta. En primer lloc, revisem l’estat de l’art dels detectors i descriptors de característiques local clàssiques i contribuïm amb dos mètodes nous que milloren intrínsecament les solucions preexistents al problema de reconstrucció d’escenes. És un fet que la informàtica i l’enginyeria del software són dos camps que solen anar de la mà i evolucionen segons necessitats mútues facilitant el disseny d’algoritmes complexos i eficients. Per aquesta raó, contribuïm amb Kornia, un llibreria dissenyada específicament per treballar amb tècniques clàssiques de visió per computador conjuntament amb xarxes neuronals profundes. En essència, hem creat un marc que facilita el disseny de processos complexes per algoritmes de visió per computador perquè es puguin incloure dins les xarxes neuronals i usar-se per propagar gradients dins d’un marc d’optimització comú. Finalment, en l’últim capítol d’aquesta tesi desenvolupem el concepte abans esmentat de dissenyar sistemes de forma conjunta amb geometria projectiva clàssica. Per tant, proposem una solució a el problema de la generació de vistes sintètiques mitjançant l’al·lucinació de vistes noves d’objectes altament deformables utilitzant un sistema conjunt amb la geometria de l’escena. En resum, en aquesta tesi demostrem que amb un disseny adequat que combini els mètodes clàssics de visió geomètrica per computador amb tècniques d’aprenentatge profund pot conduir a la millora de solucions per al problema de la reconstrucció d’escenes.