Multi-modal pedestrian detection

González Alzate, Alejandro

Multi-modal pedestrian detection

La detección de peatones continua siendo un problema muy difícil en escenarios reales, donde diferentes situaciones como cambios en iluminación, imágenes ruidosas, objetos inesperados, escenarios sin control y la variabilidad en la apariencia de los objetos ocurren constantemente. Todos estos proble...

Descripción completa

Detalles Bibliográficos
Autor:	González Alzate, Alejandro
Tipo de recurso:	tesis doctoral
Estado:	Versión publicada
Fecha de publicación:	2015
País:	España
Institución:	CBUC, CESCA
Repositorio:	TDR. Tesis Doctorales en Red
OAI Identifier:	oai:www.tdx.cat:10803/325150
Acceso en línea:	http://hdl.handle.net/10803/325150
Access Level:	acceso abierto
Palabra clave:	Detecció de vianants Detección de peatones Pedestrian detection Informació multimodal Información multimodal Multi-modal information Tecnologies 6

id	ES_c5d46eadc3f079bc868028d3a8f910bc
oai_identifier_str	oai:www.tdx.cat:10803/325150
network_acronym_str	ES
network_name_str	España
repository_id_str
dc.title.none.fl_str_mv	Multi-modal pedestrian detection
title	Multi-modal pedestrian detection
spellingShingle	Multi-modal pedestrian detection González Alzate, Alejandro Detecció de vianants Detección de peatones Pedestrian detection Informació multimodal Información multimodal Multi-modal information Tecnologies 6
title_short	Multi-modal pedestrian detection
title_full	Multi-modal pedestrian detection
title_fullStr	Multi-modal pedestrian detection
title_full_unstemmed	Multi-modal pedestrian detection
title_sort	Multi-modal pedestrian detection
dc.creator.none.fl_str_mv	González Alzate, Alejandro
author	González Alzate, Alejandro
author_facet	González Alzate, Alejandro
author_role	author
dc.contributor.none.fl_str_mv	Vázquez Bermúdez, David López Peña, Antonio Universitat Autònoma de Barcelona. Departament de Ciències de la Computació
dc.subject.none.fl_str_mv	Detecció de vianants Detección de peatones Pedestrian detection Informació multimodal Información multimodal Multi-modal information Tecnologies 6
topic	Detecció de vianants Detección de peatones Pedestrian detection Informació multimodal Información multimodal Multi-modal information Tecnologies 6
description	La detección de peatones continua siendo un problema muy difícil en escenarios reales, donde diferentes situaciones como cambios en iluminación, imágenes ruidosas, objetos inesperados, escenarios sin control y la variabilidad en la apariencia de los objetos ocurren constantemente. Todos estos problemas fuerzan el desarrollo de detectores más robustos para aplicaciones relevantes como lo son los vehículos autónomos basados en visión, vigilancia inteligente y el seguimiento de peatones para el análisis del comportamiento. Los detectores de peatones basados en visión más confiables deciden basándose en descriptores extraídos usando un único sensor y capturando características complementarias, e.g., apariencia y textura. Estas características son extraídas de una única imagen, ignorando la información temporal, o incluyendo esta información en un paso de post procesamiento e.g., seguimiento o coherencia temporal. Teniendo en cuenta estos hechos, nos formulamos la siguiente pregunta: ¿Podemos generar detectores de peatones más robustos mediante la introducción de nuevas fuentes de información en el paso de extracción de características? Para responder a esta pregunta desarrollamos diferentes propuestas para introducir nuevas fuentes de información a detectores de peatones bien conocidos. Empezamos por la inclusión de información temporal siguiendo el paradigma del aprendizaje secuencial apilado (SSL siglas en inglés), el cual sugiere que la información extraída de las muestras vecinas en una secuencia pueden mejorar la exactitud de un clasificador base. Después nos enfocamos en la inclusión de información complementaria proveniente de sensores diferentes como nubes de puntos 3D (LIDAR - profundidad), imágenes infrarrojas (FIR) o mapas de disparidad (par estéreo de cámaras). Para tal fin desarrollamos un marco multimodal en el cual información proveniente de diferentes sensores es usada para incrementar la exactitud en la detección (aumentando la redundancia de la información). Finalmente proponemos un detector multi-vista, esta propuesta multi-vista divide el problema de detección en n sub-problemas. Cada uno de estos sub-problemas detectara objetos en una vista específica dada, reduciendo así el problema de la variabilidad que se tiene cuando un único detector es usado para todo el problema. Demostramos que estas propuestas obtienen resultados competitivos con otros métodos en el estado del arte, pero envés de diseñar nuevas características, reutilizamos las existentes para mejorar el desempeño.
publishDate	2015
dc.date.none.fl_str_mv	2015 2015 2016
dc.type.none.fl_str_mv	info:eu-repo/semantics/doctoralThesis info:eu-repo/semantics/publishedVersion
format	doctoralThesis
status_str	publishedVersion
dc.identifier.none.fl_str_mv	http://hdl.handle.net/10803/325150
url	http://hdl.handle.net/10803/325150
dc.language.none.fl_str_mv	Inglés
language_invalid_str_mv	Inglés
dc.rights.none.fl_str_mv	http://creativecommons.org/licenses/by-nc-nd/3.0/es/ info:eu-repo/semantics/openAccess
rights_invalid_str_mv	http://creativecommons.org/licenses/by-nc-nd/3.0/es/
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	100 p. application/pdf application/pdf
dc.publisher.none.fl_str_mv	Universitat Autònoma de Barcelona
publisher.none.fl_str_mv	Universitat Autònoma de Barcelona
dc.source.none.fl_str_mv	TDX (Tesis Doctorals en Xarxa) reponame:TDR. Tesis Doctorales en Red instname:CBUC, CESCA
instname_str	CBUC, CESCA
reponame_str	TDR. Tesis Doctorales en Red
collection	TDR. Tesis Doctorales en Red
repository.name.fl_str_mv
repository.mail.fl_str_mv
_version_	1869419021986693120
spelling	Multi-modal pedestrian detectionGonzález Alzate, AlejandroDetecció de vianantsDetección de peatonesPedestrian detectionInformació multimodalInformación multimodalMulti-modal informationTecnologies6La detección de peatones continua siendo un problema muy difícil en escenarios reales, donde diferentes situaciones como cambios en iluminación, imágenes ruidosas, objetos inesperados, escenarios sin control y la variabilidad en la apariencia de los objetos ocurren constantemente. Todos estos problemas fuerzan el desarrollo de detectores más robustos para aplicaciones relevantes como lo son los vehículos autónomos basados en visión, vigilancia inteligente y el seguimiento de peatones para el análisis del comportamiento. Los detectores de peatones basados en visión más confiables deciden basándose en descriptores extraídos usando un único sensor y capturando características complementarias, e.g., apariencia y textura. Estas características son extraídas de una única imagen, ignorando la información temporal, o incluyendo esta información en un paso de post procesamiento e.g., seguimiento o coherencia temporal. Teniendo en cuenta estos hechos, nos formulamos la siguiente pregunta: ¿Podemos generar detectores de peatones más robustos mediante la introducción de nuevas fuentes de información en el paso de extracción de características? Para responder a esta pregunta desarrollamos diferentes propuestas para introducir nuevas fuentes de información a detectores de peatones bien conocidos. Empezamos por la inclusión de información temporal siguiendo el paradigma del aprendizaje secuencial apilado (SSL siglas en inglés), el cual sugiere que la información extraída de las muestras vecinas en una secuencia pueden mejorar la exactitud de un clasificador base. Después nos enfocamos en la inclusión de información complementaria proveniente de sensores diferentes como nubes de puntos 3D (LIDAR - profundidad), imágenes infrarrojas (FIR) o mapas de disparidad (par estéreo de cámaras). Para tal fin desarrollamos un marco multimodal en el cual información proveniente de diferentes sensores es usada para incrementar la exactitud en la detección (aumentando la redundancia de la información). Finalmente proponemos un detector multi-vista, esta propuesta multi-vista divide el problema de detección en n sub-problemas. Cada uno de estos sub-problemas detectara objetos en una vista específica dada, reduciendo así el problema de la variabilidad que se tiene cuando un único detector es usado para todo el problema. Demostramos que estas propuestas obtienen resultados competitivos con otros métodos en el estado del arte, pero envés de diseñar nuevas características, reutilizamos las existentes para mejorar el desempeño.Pedestrian detection continues to be an extremely challenging problem in real scenarios, in which situations like illumination changes, noisy images, unexpected objects, uncontrolled scenarios and variant appearance of objects occur constantly. All these problems force the development of more robust detectors for relevant applications like vision-based autonomous vehicles, intelligent surveillance, and pedestrian tracking for behavior analysis. Most reliable vision-based pedestrian detectors base their decision on features extracted using a single sensor capturing complementary features, e.g., appearance, and texture. These features usually are extracted from the current frame, ignoring temporal information, or including it in a post process step e.g., tracking or temporal coherence. Taking into account these issues we formulate the following question: can we generate more robust pedestrian detectors by introducing new information sources in the feature extraction step? In order to answer this question we develop different approaches for introducing new information sources to well-known pedestrian detectors. We start by the inclusion of temporal information following the Stacked Sequential Learning (SSL) paradigm which suggests that information extracted from the neighboring samples in a sequence can improve the accuracy of a base classifier. We then focus on the inclusion of complementary information from different sensors like 3D point clouds (LIDAR - depth), far infrared images (FIR), or disparity maps (stereo pair cameras). For this end we develop a multi-modal framework in which information from different sensors is used for increasing detection accuracy (by increasing information redundancy). Finally we propose a multi-view pedestrian detector, this multi-view approach splits the detection problem in n sub-problems. Each sub-problem will detect objects in a given specific view reducing in that way the variability problem faced when a single detectors is used for the whole problem. We show that these approaches obtain competitive results with other state-of-the-art methods but instead of design new features, we reuse existing ones boosting their performance.Universitat Autònoma de BarcelonaVázquez Bermúdez, DavidLópez Peña, AntonioUniversitat Autònoma de Barcelona. Departament de Ciències de la Computació201520162015info:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/publishedVersion100 p.application/pdfapplication/pdfhttp://hdl.handle.net/10803/325150TDX (Tesis Doctorals en Xarxa)reponame:TDR. Tesis Doctorales en Redinstname:CBUC, CESCAInglésL'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-nd/3.0/es/http://creativecommons.org/licenses/by-nc-nd/3.0/es/info:eu-repo/semantics/openAccessoai:www.tdx.cat:10803/3251502026-06-14T12:46:07Z
score	15,300724

Multi-modal pedestrian detection

Similares en LA Referencia