Back to Search Start Over

Un formalisme pour la construction automatique d'interactions dans les SMA réactifs

Authors :
Thomas, Vincent
Bourjot, Christine
Chevrier, Vincent
Autonomous intelligent machine (MAIA)
INRIA Lorraine
Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Laboratoire Lorrain de Recherche en Informatique et ses Applications (LORIA)
Institut National de Recherche en Informatique et en Automatique (Inria)-Université Henri Poincaré - Nancy 1 (UHP)-Université Nancy 2-Institut National Polytechnique de Lorraine (INPL)-Centre National de la Recherche Scientifique (CNRS)-Université Henri Poincaré - Nancy 1 (UHP)-Université Nancy 2-Institut National Polytechnique de Lorraine (INPL)-Centre National de la Recherche Scientifique (CNRS)
Centre National de la Recherche Scientifique (CNRS)-Institut National Polytechnique de Lorraine (INPL)-Université Nancy 2-Université Henri Poincaré - Nancy 1 (UHP)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Institut National Polytechnique de Lorraine (INPL)-Université Nancy 2-Université Henri Poincaré - Nancy 1 (UHP)
Source :
Journées Francophones sur les Systemes Multi-Agents-JFSMA'2004, Journées Francophones sur les Systemes Multi-Agents-JFSMA'2004, 2004, Paris, France, 6 p
Publication Year :
2004
Publisher :
HAL CCSD, 2004.

Abstract

Colloque avec actes et comité de lecture. nationale.; National audience; Nous proposons un nouveau formalisme de représentation des actions et des interactions dans les SMA réactifs inspiré des processus de décision Markovien décentralisés (DEC-MDP). Ce formalisme appelé Interac-DEC-MDP permet de représenter dans un même cadre homogène les actions individuelles et les inter\-actions directes entre agents. Ainsi il permet de calculer automatiquement les prises de décisions des agents relativement aux actions et aux déclenchements et résolution des interactions par l'introduction de la rationalité au travers de la notion de récompense. Un premier problème simple de partage de ressources impliquant 2 agents a été modélisé selon le formalisme proposé et les comportements des agents ont été construits automatiquement par Q-learning. Les premiers résultats bien qu'obtenus avec des hypothèses limitatives montrent qu'il est possible à partir d'apprentissages simples de construire automatiquement des comportements collectifs pertinents.

Details

Language :
French
Database :
OpenAIRE
Journal :
Journées Francophones sur les Systemes Multi-Agents-JFSMA'2004, Journées Francophones sur les Systemes Multi-Agents-JFSMA'2004, 2004, Paris, France, 6 p
Accession number :
edsair.dedup.wf.001..983bab702ffc6e0715fe54104762bc00