Point-Cloud Instance Segmentation for Spinning Laser Sensors

[ES] En este artículo, abordamos el problema de la segmentación de nubes de puntos para sensores LIDAR desde una perspectiva de aprendizaje profundo (DL). Dado que los sensores proporcionan de forma nativa sus mediciones en una cuadrícula 2D, utilizamos directamente modelos de visión por computador...

Descripción completa

Detalles Bibliográficos
Autores: Casado-Coscolla, Álvaro, Sanchez-Belenguer, Carlos, Wolfart, Erik, Sequeira, Vitor
Tipo de recurso: artículo
Fecha de publicación:2024
País:España
Institución:Universitat Politècnica de València (UPV)
Repositorio:RiuNet. Repositorio Institucional de la Universitat Politécnica de Valéncia
Idioma:inglés
OAI Identifier:oai:riunet.upv.es:10251/221677
Acceso en línea:https://riunet.upv.es/handle/10251/221677
Access Level:acceso abierto
Palabra clave:3D data mining
3D instance segmentation
LiDAR
Deep learning
Descripción
Sumario:[ES] En este artículo, abordamos el problema de la segmentación de nubes de puntos para sensores LIDAR desde una perspectiva de aprendizaje profundo (DL). Dado que los sensores proporcionan de forma nativa sus mediciones en una cuadrícula 2D, utilizamos directamente modelos de visión por computador para la tarea de segmentación y, a continuación, explotamos la información de profundidad para garantizar la precisión tridimensional. Esto nos permite abordar eficazmente los principales retos de la aplicación de técnicas de DL a nubes de puntos, es decir, la falta de estructura y el aumento de la dimensionalidad en los datos. Hasta donde sabemos, éste es el primer trabajo que afronta el problema de la segmentación 3D desde una perspectiva 2D sin reproyectar explícitamente nubes de puntos 3D. Además, nuestro enfoque explota múltiples canales disponibles en los sensores modernos, es decir, profundidad, reflectividad e iluminación ambiental. También introducimos un novedoso proceso de minería de datos que permite la anotación de escaneos 3D sin intervención humana. Junto con este artículo, presentamos un nuevo dataset público con todos los datos recopilados para entrenar y evaluar nuestro modelo, en el que las nubes de puntos conservan la estructura nativa del sensor y en el que cada medición contiene información sobre el profundidad, la reflectividad y la iluminación ambiental. Como demuestran los resultados experimentales, nuestro método alcanza los mejores resultados tanto en términos de precisión como de tiempo de inferencia. Además, proporcionamos una nueva prueba de ablación que analiza las contribuciones individuales y combinadas de los distintos canales proporcionados.