Research on reinforcement learning methods : a practical study

El aprendizaje por refuerzo ha mejorado significativamente en las últimas décadas, haciendo importantes contribuciones a una amplia gama de campos en Inteligencia Artificial. Mientras que la investigación en este campo ha crecido considerablemente, algunos de los proyectos más impactantes han demost...

Descripción completa

Detalles Bibliográficos
Autor: Pinilla Martínez, Fernando Javier
Tipo de recurso: tesis de maestría
Fecha de publicación:2017
País:España
Institución:Ministerio de Educación y Formación Profesional (MEFP)
Repositorio:Redined. Red de Información Educativa
OAI Identifier:oai:redined.educacion.gob.es:11162/190007
Acceso en línea:http://hdl.handle.net/11162/190007
http://oa.upm.es/47887/1/TFM_FERNANDO_PINILLA_MARTINEZ.pdf
Access Level:acceso abierto
Palabra clave:inteligencia artificial
enseñanza automatizada
juego educativo
estrategia de aprendizaje
Descripción
Sumario:El aprendizaje por refuerzo ha mejorado significativamente en las últimas décadas, haciendo importantes contribuciones a una amplia gama de campos en Inteligencia Artificial. Mientras que la investigación en este campo ha crecido considerablemente, algunos de los proyectos más impactantes han demostrado la eficacia de las metodologías y los principios del aprendizaje por refuerzo cuando se combinan con otros métodos como las cada vez más importantes redes neuronales artificiales. Un ejemplo de esto es la codificación de un agente de inteligencia artificial que logra resultados sobrehumanos en diferentes tareas como juego de mesa o visión por computador. El objetivo principal de este proyecto es adquirir un conocimiento y comprensión profundos acerca de las ventajas y desventajas del aprendizaje por refuerzo en contraste con otros campos comunes en aprendizaje automático como el aprendizaje supervisado y el aprendizaje no supervisado. El presente proyecto estudia el aprendizaje por refuerzo a partir de sus principios básicos y presenta algunos de los métodos y algoritmos más avanzados. Una implementación de un algoritmo de aprendizaje de refuerzo es llevada a cabo para resolver un simple problema de encontrar las mejores acciones en el juego de mesa Tic-Tac-Toe, utilizando uno de los algoritmos más relevantes en la materia llamado Q-Learning. Se presentan otras características interesantes sobre el aprendizaje por refuerzo junto con las principales líneas abiertas de investigación que se están estudiando actualmente.