Un Algorithme Amélioré d'Itération de la Politique Approchée pour les Processus Décisionnels Semi-Markoviens Généralisés

Authors :: Rachelson, Emmanuel
Fabiani, Patrick
Garcia, Frédérick
Institut National de la Recherche Agronomique - INRA (FRANCE)
Office National d'Etudes et Recherches Aérospatiales - ONERA (FRANCE)
Publication Year :: 2008
Abstract: La complexité des problèmes de décision dans l'incertain dépendant du temps provient sou-vent de l'interaction de plusieurs processus concurrents. Les Processus Décisionnels Semi-Markoviens Généralisés (GSMDP) consituent un formalisme efficace et élégant pour représenter à la fois les aspects de concurrence d'événements et d'actions et d'incertitude. Nous proposons un formalisme GSMDP étendu à un temps observable et un espace d'états hybride. Sur cette base, nous introduisons un nouvel algorithme inspiré de l'itération de la politique approchée afin de construire des politiques efficaces. Cet algorithme repose sur une exploration guidée par la simulation et utilise les techniques d'appren-tissage à vecteurs supports. Nous illustrons cet algorithme sur un exemple et en proposons une version améliorée qui compense sa principale faiblesse.

Subjects :: Planification
Processus Décisionnels de Markov
Apprentissage par renforcement
Réseaux et télécommunications
Simulation

Tools