Deep learning for image captioning: an encoder-decoder architecture with soft attention

Gómez Martínez, Mario

Deep learning for image captioning: an encoder-decoder architecture with soft attention

El subtitulado automático de imágenes, la tarea de producir automáticamente una descripción en lenguaje natural para una imagen, tiene el potencial de ayudar a las personas con discapacidades visuales a explicar las imágenes mediante sistemas de conversión de texto a voz. Sin embargo, el subtitulado...

Descripción completa

Detalles Bibliográficos
Autor:	Gómez Martínez, Mario
Tipo de recurso:	tesis de maestría
Fecha de publicación:	2019
País:	España
Institución:	Universitat Oberta de Catalunya (UOC)
Repositorio:	O2, repositorio institucional de la UOC
OAI Identifier:	oai:openaccess.uoc.edu:10609/100446
Acceso en línea:	http://hdl.handle.net/10609/100446
Access Level:	acceso abierto
Palabra clave:	subtitulado de imágenes aprendizaje profundo redes neuronales artificiales image captioning deep learning artificial neural networks aprenentatge profund xarxes neuronals artificials subtitulat d'imatges Machine learning -- TFM Aprenentatge automàtic -- TFM Aprendizaje automático -- TFM

Descripción
Sumario:	El subtitulado automático de imágenes, la tarea de producir automáticamente una descripción en lenguaje natural para una imagen, tiene el potencial de ayudar a las personas con discapacidades visuales a explicar las imágenes mediante sistemas de conversión de texto a voz. Sin embargo, el subtitulado preciso de imágenes es una tarea desafiante que requiere integrar y avanzar en la intersección de los campos de procesamiento de lenguaje natural y visión por computador. Este trabajo pretende desarrollar un modelo basado en redes neuronales y aprendizaje profundo para la generación automática de descripciones de imágenes.

Deep learning for image captioning: an encoder-decoder architecture with soft attention

Similares en LA Referencia