Deep learning for image captioning: an encoder-decoder architecture with soft attention
El subtitulado automático de imágenes, la tarea de producir automáticamente una descripción en lenguaje natural para una imagen, tiene el potencial de ayudar a las personas con discapacidades visuales a explicar las imágenes mediante sistemas de conversión de texto a voz. Sin embargo, el subtitulado...
| Autor: | |
|---|---|
| Tipo de recurso: | tesis de maestría |
| Fecha de publicación: | 2019 |
| País: | España |
| Institución: | Universitat Oberta de Catalunya (UOC) |
| Repositorio: | O2, repositorio institucional de la UOC |
| OAI Identifier: | oai:openaccess.uoc.edu:10609/100446 |
| Acceso en línea: | http://hdl.handle.net/10609/100446 |
| Access Level: | acceso abierto |
| Palabra clave: | subtitulado de imágenes aprendizaje profundo redes neuronales artificiales image captioning deep learning artificial neural networks aprenentatge profund xarxes neuronals artificials subtitulat d'imatges Machine learning -- TFM Aprenentatge automàtic -- TFM Aprendizaje automático -- TFM |
| Sumario: | El subtitulado automático de imágenes, la tarea de producir automáticamente una descripción en lenguaje natural para una imagen, tiene el potencial de ayudar a las personas con discapacidades visuales a explicar las imágenes mediante sistemas de conversión de texto a voz. Sin embargo, el subtitulado preciso de imágenes es una tarea desafiante que requiere integrar y avanzar en la intersección de los campos de procesamiento de lenguaje natural y visión por computador. Este trabajo pretende desarrollar un modelo basado en redes neuronales y aprendizaje profundo para la generación automática de descripciones de imágenes. |
|---|