Procesos de decisión de Markov bajo el criterio de entropía relativa

"El tema principal de este trabajo de tesis es Procesos de Decisión de Markov (PDMs). Un PDM es aquél que modela, mediante un Modelo de Control de Markov, un sistema observado en el tiempo por un controlador o agente decisor que influye en la evolución del sistema. El controlador decide la acci...

ver descrição completa

Detalhes bibliográficos
Autores: SALGADO SUAREZ, GLADYS DENISSE; 508569, Salgado Suárez, Gladys Denisse
Tipo de documento: tese
Estado:Versão publicada
Data de publicação:2019
País:México
Recursos:Benemérita Universidad Autónoma de Puebla
Repositório:Repositorio Institucional de Acceso Abierto RIAA-BUAP
Idioma:espanhol
OAI Identifier:oai:repositorioinstitucional.buap.mx:20.500.12371/4646
Acesso em linha:https://hdl.handle.net/20.500.12371/4646
Access Level:Acceso aberto
Palavra-chave:CIENCIAS FÍSICO MATEMÁTICAS Y CIENCIAS DE LA TIERRA
Procesos de Markov
Decisión estadística
Procesos estocásticos--Procesamiento de datos
Programación dinámica
Teoría de la información
Shortest path problem
Descrição
Resumo:"El tema principal de este trabajo de tesis es Procesos de Decisión de Markov (PDMs). Un PDM es aquél que modela, mediante un Modelo de Control de Markov, un sistema observado en el tiempo por un controlador o agente decisor que influye en la evolución del sistema. El controlador decide la acción (control) a tomar dependiendo del estado actual con el objetivo de que el sistema se desempeñe eficazmente con respecto a cierto criterio de optimalidad (función objetivo o criterio de rendimiento). La acción genera un costo (o recompensa) a pagarse y repercute en el nuevo estado del sistema de acuerdo con una distribución de probabilidad preestablecida. Este procedimiento de selección se repite de manera periódica hasta cierto momento dado llamado horizonte del problema, a la sucesión de acciones determinada se le denomina política. La mejor política será aquella que optimice el criterio de optimalidad, lo cual da origen al problema de control óptimo [18], [30]."