Nuevo método de aceleración de los procesos de decisión de Markov

MA. DE GUADALUPE GARCIA HERNANDEZ; JOSE RUIZ PINALES; SERGIO EDUARDO LEDESMA OROZCO; JUAN GABRIEL AVIÑA CERVANTES; EDGAR ALVARADO MENDEZ

Nuevo método de aceleración de los procesos de decisión de Markov

En este artículo se presenta un nuevo método de aceleración para resolver a los procesos de decisión de Markov. El clásico algoritmo de iteración de valor ha resuelto satisfactoriamente a estos procesos estocásticos, pero este algoritmo y sus variantes aceleradas han sido lentos con factores de desc...

Full description

Bibliographic Details
Authors:	MA. DE GUADALUPE GARCIA HERNANDEZ, JOSE RUIZ PINALES, SERGIO EDUARDO LEDESMA OROZCO, JUAN GABRIEL AVIÑA CERVANTES, EDGAR ALVARADO MENDEZ
Format:	article
Status:	Published version
Publication Date:	2012
Country:	México
Institution:	Universidad de Guanajuato
Repository:	Repositorio Institucional de la Universidad de Guanajuato
Language:	Spanish
OAI Identifier:	oai:repositorio.ugto.mx:20.500.12059/1162
Online Access:	http://repositorio.ugto.mx/handle/20.500.12059/1162
Access Level:	Open access
Keyword:	info:eu-repo/classification/cti/7 Procesos de decisión de Markov Ordenamiento topológico Ruta mas corta Markov decision processes Topological ordering Shortest path

Description
Summary:	En este artículo se presenta un nuevo método de aceleración para resolver a los procesos de decisión de Markov. El clásico algoritmo de iteración de valor ha resuelto satisfactoriamente a estos procesos estocásticos, pero este algoritmo y sus variantes aceleradas han sido lentos con factores de descuento cercanos a la unidad y sus propiedades de convergencia han dependido, en gran medida, de un buen ordenamiento en la actualización de estados. Recientemente se mostró que la iteración de valor presenta buena velocidad de convergencia gracias al uso de un algoritmo de ordenamiento topológico mejorado. Sin embargo, la desventaja de este algoritmo es debida a sus requerimientos de memoria. Aquí se presenta un método diferente para obtener un buen ordenamiento de estados actualizados con menor requerimiento de memoria. De igual manera se presentan los resultados experimentales obtenidos sobre un problema de ruta estocástica más corta.

Nuevo método de aceleración de los procesos de decisión de Markov

Similar Items