Deep learning for image captioning: an encoder-decoder architecture with soft attention

El subtitulado automático de imágenes, la tarea de producir automáticamente una descripción en lenguaje natural para una imagen, tiene el potencial de ayudar a las personas con discapacidades visuales a explicar las imágenes mediante sistemas de conversión de texto a voz. Sin embargo, el subtitulado...

Descripción completa

Detalles Bibliográficos
Autor: Gómez Martínez, Mario
Tipo de recurso: tesis de maestría
Fecha de publicación:2019
País:España
Institución:Universitat Oberta de Catalunya (UOC)
Repositorio:O2, repositorio institucional de la UOC
OAI Identifier:oai:openaccess.uoc.edu:10609/100446
Acceso en línea:http://hdl.handle.net/10609/100446
Access Level:acceso abierto
Palabra clave:subtitulado de imágenes
aprendizaje profundo
redes neuronales artificiales
image captioning
deep learning
artificial neural networks
aprenentatge profund
xarxes neuronals artificials
subtitulat d'imatges
Machine learning -- TFM
Aprenentatge automàtic -- TFM
Aprendizaje automático -- TFM
Descripción
Sumario:El subtitulado automático de imágenes, la tarea de producir automáticamente una descripción en lenguaje natural para una imagen, tiene el potencial de ayudar a las personas con discapacidades visuales a explicar las imágenes mediante sistemas de conversión de texto a voz. Sin embargo, el subtitulado preciso de imágenes es una tarea desafiante que requiere integrar y avanzar en la intersección de los campos de procesamiento de lenguaje natural y visión por computador. Este trabajo pretende desarrollar un modelo basado en redes neuronales y aprendizaje profundo para la generación automática de descripciones de imágenes.