Implementación de Iteración de Políticas e Iteración de Valor en MATLAB para Programación Dinámica
Fundamentos teóricos
La programación dinámica (PD) aborda problemas de decisión secuencial dividiendo el problema en subproblemas anidados. Los elementos clave son:
Estado \( s\in S \): situación del sistema en un instante.
Acción \( a\in A \): decisión ejecutable desde un estado.
Probabilidad de transición \( P(s'|s,a) \): probabilidad de lle ...
Publicado el 6-20 01:03