Computational model of visual perception

La idea original de este proyecto fue estudiar la importancia del color en el reconocimiento de objetos. Comenzamos extendiendo la investigación previa sobre nombrar colores y demostrando la viabilidad de capturar términos de color a través de elipsoides. Aunque nuestros resultados superaron el esta...

Descripción completa

Detalles Bibliográficos
Autor: Akbarinia, SeyedArash
Tipo de recurso: tesis doctoral
Fecha de publicación:2017
País:España
Institución:Universitat Autònoma de Barcelona
Repositorio:Dipòsit Digital de Documents de la UAB
Idioma:inglés
OAI Identifier:oai:ddd.uab.cat:187726
Acceso en línea:https://ddd.uab.cat/record/187726
Access Level:acceso abierto
Palabra clave:Percepció visual
Visió per ordinador
Color
Descripción
Sumario:La idea original de este proyecto fue estudiar la importancia del color en el reconocimiento de objetos. Comenzamos extendiendo la investigación previa sobre nombrar colores y demostrando la viabilidad de capturar términos de color a través de elipsoides. Aunque nuestros resultados superaron el estado-del-arte en dos bases de datos, vimos que los fenómenos de luces metaméricas y constancia de color debían ser tratados antes de cualquier procesamiento de color. Nuestra investigación de pares metaméricas mostró que son infrecuentes en el mundo real. Contrariamente a eso, la iluminación de una escena a menudo cambia drásticamente. Abordamos este problema proponiendo un modelo de constancia de color inspirado en la adaptación dinámica del centro-envolvente de las neuronas en la corteza visual. Esto se implementa a través de dos gaussianos asimétricos superpuestos, cuyas varianzas y alturas se ajustan al contraste local. Complementamos este modelo con un mecanismo genérico de agrupación variante por contraste que inversamente conecta el porcentaje de señal agrupada al contraste de una región. Los resultados sobre cuatro bases de datos fueron prometedores: nuestro modelo superó incluso los enfoques basados en el aprendizaje en muchos casos. Alentados por el éxito obtenido, ampliamos este enfoque para detectar los bordes de los objetos. Proponemos un modelo de detección de bordes basado en la primera derivada del kernel gaussiano. Incorporamos cuatro tipos de envolvente: completa, distante, orientación isogonal y ortogonal. Además, contamos con el mecanismo de agrupación en las áreas corticales superiores y la retroalimentación de la forma enviada a las zonas más bajas. Nuestros resultados en tres bases de datos mejoraron el estado-del-arte en los algoritmos sin aprendizaje. En resumen, hemos demostrado que los modelos inspirados biológicamente ofrecen soluciones para visión por computador, como nombrar colores, constancia de color y detección de bordes. Creemos que la mayor contribución de esta tesis doctoral es el modelado del concepto de modulación envolvente dinámica que muestra la importancia de la integración de envolvente variante por contraste. Los modelos propuestos se basan en sólo una parte de lo que sabemos sobre la visión humana. Por lo tanto, es natural complementarlos en trabajos futuros