Procesos de Markov con costo promedio

En esta tesis se estudian procesos de control de Markov en espacios de Borel con costo promedio, permitiendo que la función costo sea no acotada, y que los conjuntos de controles admisibles en cada estado no sean compactos. El objetivo principal consiste en proponer condiciones que garanticen la exi...

Descripción completa

Detalles Bibliográficos
Autor: JOSE RAUL MONTES DE OCA MACHORRO
Tipo de recurso: tesis doctoral
Estado:Versión publicada
Fecha de publicación:1994
País:México
Institución:Universidad Autónoma Metropolitana
Repositorio:Repositorio Institucional de la UAM Iztapalapa
Idioma:español
OAI Identifier:oai:bindani.izt.uam.mx:xk81jk41k
Acceso en línea:https://doi.org/10.24275/uami.xk81jk41k
Access Level:acceso abierto
Palabra clave:info:eu-repo/classification/LEM/Conjuntos de Borel
info:eu-repo/classification/LEM/Procesos de Markov
info:eu-repo/classification/LEM/Markov processes
info:eu-repo/classification/LEM/Borel sets
info:eu-repo/classification/cti/1
Descripción
Sumario:En esta tesis se estudian procesos de control de Markov en espacios de Borel con costo promedio, permitiendo que la función costo sea no acotada, y que los conjuntos de controles admisibles en cada estado no sean compactos. El objetivo principal consiste en proponer condiciones que garanticen la existencia de políticas óptimas y que permitan. caracterizar dichas políticas, así como el valor promedio óptimo, mediante técnicas de Programación Dinámica. Las condiciones propuestas en este trabajo están dadas principalmente en base a la función de valor óptimo para problemas de control con costo total descontado, por lo que el trabajo cae en el ·contexto del método del "factor de descuento desvaneciente". Tales condiciones permiten obtener soluciones de la desigualdad y de la ecuación de optimalidad, que a su vez permiten obtener y caracterizar políticas óptimas y el valor promedio óptimo. Bajo condiciones adicionales, también se obtiene la convergencia del algoritmo de iteración de valores. La generalidad de nuestras condiciones permite que sean aplicables a la mayoría de los modelos de control de Markov que surgen en la teoría de control estocástico en tiempo discreto. Esto permite, en particular, ilustrar nuestros resultados con el problema del regulador lineal con costo cuadrático, para el cual no son aplicables resultados anteriores.