102 results on '"Beynier, Aurélie"'
Search Results
2. On the Notion of Envy Among Groups of Agents in House Allocation Problems
- Author
-
Gross-Humbert, Nathanaël, primary, Benabbou, Nawal, additional, Beynier, Aurélie, additional, and Maudet, Nicolas, additional
- Published
- 2023
- Full Text
- View/download PDF
3. An Optimal Procedure to Check Pareto-Optimality in House Markets with Single-Peaked Preferences
- Author
-
Beynier, Aurélie, Maudet, Nicolas, Rey, Simon, and Shams, Parham
- Subjects
Computer Science - Computer Science and Game Theory ,Computer Science - Artificial Intelligence - Abstract
Recently, the problem of allocating one resource per agent with initial endowments (house markets) has seen a renewed interest: indeed, while in the domain of strict preferences the Top Trading Cycle algorithm is known to be the only procedure guaranteeing Pareto-optimality, individual rationality, and strategy proofness. However, the situation differs in the single-peaked domain. Indeed, Bade presented the Crawler, an alternative procedure enjoying the same properties, with the additional advantage of being implementable in obviously dominant strategies. In this paper we further investigate the Crawler and propose the Diver, a variant which checks optimally whether an allocation is Pareto-optimal for single-peaked preferences, thus improving over known techniques used for checking Pareto-optimality in more general domains. We also prove that the Diver is asymptotically optimal in terms of communication complexity., Comment: Was initially part of our submission arXiv:1906.10250. We followed recommendations to make a distinct contribution with this material
- Published
- 2020
4. Fair in the Eyes of Others
- Author
-
Shams, Parham, Beynier, Aurélie, Bouveret, Sylvain, and Maudet, Nicolas
- Subjects
Computer Science - Artificial Intelligence ,Computer Science - Multiagent Systems - Abstract
Envy-freeness is a widely studied notion in resource allocation, capturing some aspects of fairness. The notion of envy being inherently subjective though, it might be the case that an agent envies another agent, but that she objectively has no reason to do so. The difficulty here is to define the notion of objectivity, since no ground-truth can properly serve as a basis of this definition. A natural approach is to consider the judgement of the other agents as a proxy for objectivity. Building on previous work by Parijs (who introduced "unanimous envy") we propose the notion of approval envy: an agent $a_i$ experiences approval envy towards $a_j$ if she is envious of $a_j$, and sufficiently many agents agree that this should be the case, from their own perspectives. Some interesting properties of this notion are put forward. Computing the minimal threshold guaranteeing approval envy clearly inherits well-known intractable results from envy-freeness, but (i) we identify some tractable cases such as house allocation; and (ii) we provide a general method based on a mixed integer programming encoding of the problem, which proves to be efficient in practice. This allows us in particular to show experimentally that existence of such allocations, with a rather small threshold, is very often observed.
- Published
- 2019
5. Swap Dynamics in Single-Peaked Housing Markets
- Author
-
Beynier, Aurélie, Maudet, Nicolas, Rey, Simon, and Shams, Parham
- Subjects
Computer Science - Artificial Intelligence ,Computer Science - Multiagent Systems - Abstract
This paper focuses on the problem of fairly and efficiently allocating resources to agents. We consider a specific setting, usually referred to as a housing market, where each agent must receive exactly one resource (and initially owns one). In this framework, in the domain of linear preferences, the Top Trading Cycle (TTC) algorithm is the only procedure satisfying Pareto-optimality, individual rationality and strategy-proofness. Under the restriction of single-peaked preferences, Crawler enjoys the same properties. These two centralized procedures might however involve long trading cycles. In this paper we focus instead on procedures involving the shortest cycles: bilateral swap-deals. In such swap dynamics, the agents perform pairwise mutually improving deals until reaching a swap-stable allocation (no improving swap-deal is possible). We prove that in the single-peaked domain every swap-stable allocation is Pareto-optimal, showing the efficiency of the swap dynamics. In fact, this domain turns out to be maximal when it comes to guaranteeing this property. Besides, both the outcome of TTC and Crawler can always be reached by sequences of swaps. However, some Pareto-optimal allocations are not reachable through improving swap-deals. We further analyze the outcome of swap dynamics through social welfare notions, in our context the average or minimum rank of the resources obtained by agents in the final allocation. We start by providing a worst-case analysis of these procedures. Finally, we present an extensive experimental study in which different versions of swap dynamics are compared to other existing allocation procedures. We show that they exhibit good results on average in this domain, under different cultures for generating synthetic data., Comment: Replaces our previous submission: "House Markets and Single-Peaked Preferences: From Centralized to Decentralized Allocation Procedures". Following reviewers' comments, leaves out our contribution on a variant of the Crawler procedure (goes in a separate submission) to concentrate on swap dynamics (new results added)
- Published
- 2019
6. Efficiency, Sequenceability and Deal-Optimality in Fair Division of Indivisible Goods
- Author
-
Beynier, Aurélie, Bouveret, Sylvain, Lemaître, Michel, Maudet, Nicolas, and Rey, Simon
- Subjects
Computer Science - Artificial Intelligence ,Computer Science - Multiagent Systems - Abstract
In fair division of indivisible goods, using sequences of sincere choices (or picking sequences) is a natural way to allocate the objects. The idea is as follows: at each stage, a designated agent picks one object among those that remain. Another intuitive way to obtain an allocation is to give objects to agents in the first place, and to let agents exchange them as long as such "deals" are beneficial. This paper investigates these notions, when agents have additive preferences over objects, and unveils surprising connections between them, and with other efficiency and fairness notions. In particular, we show that an allocation is sequenceable iff it is optimal for a certain type of deals, namely cycle deals involving a single object. Furthermore, any Pareto-optimal allocation is sequenceable, but not the converse. Regarding fairness, we show that an allocation can be envy-free and non-sequenceable, but that every competitive equilibrium with equal incomes is sequenceable. To complete the picture, we show how some domain restrictions may affect the relations between these notions. Finally, we experimentally explore the links between the scales of efficiency and fairness., Comment: arXiv admin note: substantial text overlap with arXiv:1604.01734
- Published
- 2018
7. Minimizing and Balancing Envy Among Agents Using Ordered Weighted Average
- Author
-
Shams, Parham, Beynier, Aurélie, Bouveret, Sylvain, Maudet, Nicolas, Goos, Gerhard, Founding Editor, Hartmanis, Juris, Founding Editor, Bertino, Elisa, Editorial Board Member, Gao, Wen, Editorial Board Member, Steffen, Bernhard, Editorial Board Member, Woeginger, Gerhard, Editorial Board Member, Yung, Moti, Editorial Board Member, Fotakis, Dimitris, editor, and Ríos Insua, David, editor
- Published
- 2021
- Full Text
- View/download PDF
8. Swap dynamics in single-peaked housing markets
- Author
-
Beynier, Aurélie, Maudet, Nicolas, Rey, Simon, and Shams, Parham
- Published
- 2021
- Full Text
- View/download PDF
9. Minimizing and Balancing Envy Among Agents Using Ordered Weighted Average
- Author
-
Shams, Parham, primary, Beynier, Aurélie, additional, Bouveret, Sylvain, additional, and Maudet, Nicolas, additional
- Published
- 2021
- Full Text
- View/download PDF
10. Local envy-freeness in house allocation problems
- Author
-
Beynier, Aurélie, Chevaleyre, Yann, Gourvès, Laurent, Harutyunyan, Ararat, Lesca, Julien, Maudet, Nicolas, and Wilczynski, Anaëlle
- Published
- 2019
- Full Text
- View/download PDF
11. Solving Hidden-Semi-Markov-Mode Markov Decision Problems
- Author
-
Hadoux, Emmanuel, Beynier, Aurélie, Weng, Paul, Hutchison, David, Series editor, Kanade, Takeo, Series editor, Kittler, Josef, Series editor, Kleinberg, Jon M., Series editor, Kobsa, Alfred, Series editor, Mattern, Friedemann, Series editor, Mitchell, John C., Series editor, Naor, Moni, Series editor, Nierstrasz, Oscar, Series editor, Pandu Rangan, C., Series editor, Steffen, Bernhard, Series editor, Terzopoulos, Demetri, Series editor, Tygar, Doug, Series editor, Weikum, Gerhard, Series editor, Goebel, Randy, Series editor, Tanaka, Yuzuru, Series editor, Wahlster, Wolfgang, Series editor, Siekmann, Jörg, Series editor, Straccia, Umberto, editor, and Calì, Andrea, editor
- Published
- 2014
- Full Text
- View/download PDF
12. Sequential and Swap Mechanisms for Public Housing Allocation with Quotas and Neighbourhood-based Utilities
- Author
-
Gross–Humbert, Nathanaël, primary, Benabbou, Nawal, additional, Beynier, Aurélie, additional, and Maudet, Nicolas, additional
- Published
- 2023
- Full Text
- View/download PDF
13. Interleaving Planning and Control of Mobiles Robots in Urban Environments Using Road-Map
- Author
-
Lozenguez, Guillaume, Adouane, Lounis, Beynier, Aurélie, Mouaddib, Abdel-Illah, Martinet, Philippe, Lee, Sukhan, editor, Cho, Hyungsuck, editor, Yoon, Kwang-Joon, editor, and Lee, Jangmyung, editor
- Published
- 2013
- Full Text
- View/download PDF
14. Map Partitioning to Approximate an Exploration Strategy in Mobile Robotics
- Author
-
Lozenguez, Guillaume, Adouane, Lounis, Beynier, Aurélie, Martinet, Philippe, Mouaddib, Abdel-Illah, Kacprzyk, Janusz, editor, Demazeau, Yves, editor, Pěchoucěk, Michal, editor, Corchado, Juan M., editor, and Pérez, Javier Bajo, editor
- Published
- 2011
- Full Text
- View/download PDF
15. Fair in the Eyes of Others
- Author
-
Shams, Parham, primary, Beynier, Aurélie, additional, Bouveret, Sylvain, additional, and Maudet, Nicolas, additional
- Published
- 2022
- Full Text
- View/download PDF
16. Decentralized Markov Decision Processes for Handling Temporal and Resource constraints in a Multiple Robot System
- Author
-
Beynier, Aurélie, Mouaddib, Abdel-Illah, Alami, Rachid, editor, Chatila, Raja, editor, and Asama, Hajime, editor
- Published
- 2007
- Full Text
- View/download PDF
17. Punctual versus continuous auction coordination for multi-robot and multi-task topological navigation
- Author
-
Lozenguez, Guillaume, Adouane, Lounis, Beynier, Aurélie, Mouaddib, Abdel-Illah, and Martinet, Philippe
- Published
- 2016
- Full Text
- View/download PDF
18. Sequential and Swap Mechanisms for Public Housing Allocation with Quotas and Neighbourhood-Based Utilities (Extended Abstract)
- Author
-
GROSS-HUMBERT, Nathanaël, BENABBOU, Nawal, BEYNIER, Aurélie, MAUDET, Nicolas, Maudet, Nicolas, Systèmes Multi-Agents (SMA), LIP6, Sorbonne Université (SU)-Centre National de la Recherche Scientifique (CNRS)-Sorbonne Université (SU)-Centre National de la Recherche Scientifique (CNRS), and DECISION
- Subjects
[INFO.INFO-AI] Computer Science [cs]/Artificial Intelligence [cs.AI] ,Computational Social Choice ,Diversity Constraints ,Distributed Allocation Mechanisms ,Multiagent Resource Allocation ,[INFO.INFO-AI]Computer Science [cs]/Artificial Intelligence [cs.AI] - Abstract
International audience; We consider the problem of allocating indivisible items to agents where both agents and items are partitioned into disjoint groups. Following previous works on public housing allocation, each item (or house) belongs to a block and each agent is assigned a type. The allocation problem consists in assigning at most one item to each agent in a good way while respecting diversity constraints. Based on Schelling's seminal work, we introduce a generic individual utility function where the welfare of an agent not only relies on her preferences over the items but also takes into account the fraction of agents of her own type in her own block. In this context, we investigate the issue of stability, and study two existing allocation mechanisms: a sequential mechanism used in Singapore and a distributed procedure based on mutually improving swaps of items.
- Published
- 2021
19. Solving efficiently Decentralized MDPs with temporal and resource constraints
- Author
-
Beynier, Aurélie and Mouaddib, Abdel-Illah
- Published
- 2011
- Full Text
- View/download PDF
20. DEC-MDP/POMDP
- Author
-
Beynier, Aurélie, primary, Charpillet, François, additional, Szer, Daniel, additional, and Mouaddib, Abdel-Illah, additional
- Published
- 2013
- Full Text
- View/download PDF
21. Applications of DEC-MDPs in Multi-Robot Systems
- Author
-
Beynier, Aurélie, primary and Mouaddib, Abdel-Illah, additional
- Published
- 2012
- Full Text
- View/download PDF
22. CONTRIBUTIONS TO MULTIAGENT DECISION MAKING UNDER UNCERTAINTY AND PARTIAL OBSERVABILITY
- Author
-
Beynier, Aurélie, Sorbonne Université (SU), Sorbonne Université , UPMC, and Amal El Fallah Seghrouchni
- Subjects
Markovian models ,Processus Décisionnels de Markov ,Argumentation stratégique ,Resource Allocation ,[INFO.INFO-AI]Computer Science [cs]/Artificial Intelligence [cs.AI] ,Strategic Argumentation ,Intelligence Artificielle ,Allocation de ressources ,Artificial Intelligence ,[INFO.INFO-MA]Computer Science [cs]/Multiagent Systems [cs.MA] ,Planification sous incertitude ,Systèmes multiagents ,Planning under uncertainty ,Multiagent Systems - Published
- 2018
23. Mediation of Debates with Dynamic Argumentative Behaviors
- Author
-
Hadoux, Emmanuel, Beynier, Aurélie, Maudet, Nicolas, Weng, Paul, Computer science department [University College London] (UCL-CS), University College of London [London] (UCL), Systèmes Multi-Agents (SMA), LIP6, Sorbonne Université (SU)-Centre National de la Recherche Scientifique (CNRS)-Sorbonne Université (SU)-Centre National de la Recherche Scientifique (CNRS), SYSU-CMU Joint Institute of Engineering, and ANR-13-BS02-0004,AMANDE,Argumentation Multilatérale Avancée pour la DElibération(2013)
- Subjects
[INFO.INFO-AI]Computer Science [cs]/Artificial Intelligence [cs.AI] - Abstract
International audience; Mediation is a process for resolving conflicts among several entities. In argumentation debates, conflicting agents that may be organized as teams exchange arguments to persuade each other. In this paper, we consider an automated mediator , which assigns the speaking slots to agents so as to optimize some objectives and ensure the fairness of the debate. We propose a general setting where the argu-mentation strategies of the agents are probabilistically known and may evolve over time. We show that the problem can be solved as a semi-Markov decision problem with hidden modes.
- Published
- 2018
- Full Text
- View/download PDF
24. Fairness in Multiagent Resource Allocation with Dynamic and Partial Observations: Extended Abstract
- Author
-
Beynier , Aurélie, Maudet , Nicolas, Damamme , Anastasia, Systèmes Multi-Agents (SMA), LIP6, Sorbonne Université (SU)-Centre National de la Recherche Scientifique (CNRS)-Sorbonne Université (SU)-Centre National de la Recherche Scientifique (CNRS), ANR-14-CE24-0007,CoCoRICo-CoDec,Calcul, Communication, Rationalité et Incitations en Décision Collective et Coopérative(2014), Systèmes Multi-Agents ( SMA ), Laboratoire d'Informatique de Paris 6 ( LIP6 ), Université Pierre et Marie Curie - Paris 6 ( UPMC ) -Centre National de la Recherche Scientifique ( CNRS ) -Université Pierre et Marie Curie - Paris 6 ( UPMC ) -Centre National de la Recherche Scientifique ( CNRS ), and ANR-14-CE24-0007,CoCoRICo-CoDec,Calcul, Communication, Rationalité et Incitations en Décision Collective et Coopérative ( 2014 )
- Subjects
[ INFO.INFO-AI ] Computer Science [cs]/Artificial Intelligence [cs.AI] ,[INFO.INFO-AI]Computer Science [cs]/Artificial Intelligence [cs.AI] - Abstract
International audience; We investigate fairness issues in distributed resource allocation of indivisible goods. More specifically, we study envy-freeness in a setting where the observations of agents only result from encounters with other agents. Agents thus have a partial and uncertain view of the entire allocation, that they maintain throughout the process, and which allows them to have different estimates of their envy. We provide a fully distributed protocol allowing to guarantee termination despite the limited knowledge of agents.
- Published
- 2018
25. Intelligent Distributed Computing X
- Author
-
El Fallah-Seghrouchni, Amal, Costin, Badica, Beynier, Aurélie, Camacho, David, Herpson, Cédric, Hindriks, Koen, Novais, Paulo, Systèmes Multi-Agents (SMA), Laboratoire d'Informatique de Paris 6 (LIP6), Université Pierre et Marie Curie - Paris 6 (UPMC)-Centre National de la Recherche Scientifique (CNRS)-Université Pierre et Marie Curie - Paris 6 (UPMC)-Centre National de la Recherche Scientifique (CNRS), Laboratory of Atomistic Simulation (LSIM ), Modélisation et Exploration des Matériaux (MEM), Université Grenoble Alpes [2016-2019] (UGA [2016-2019])-Institut de Recherche Interdisciplinaire de Grenoble (IRIG), Direction de Recherche Fondamentale (CEA) (DRF (CEA)), Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Direction de Recherche Fondamentale (CEA) (DRF (CEA)), Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université Grenoble Alpes [2016-2019] (UGA [2016-2019])-Institut de Recherche Interdisciplinaire de Grenoble (IRIG), Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA), Department of Intelligent Systems (Delft, Netherlands), University of Minho [Braga], Springer International Publishing, Institut de Recherche Interdisciplinaire de Grenoble (IRIG), and Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université Grenoble Alpes [2016-2019] (UGA [2016-2019])
- Subjects
ComputingMilieux_MISCELLANEOUS ,[INFO.INFO-AI]Computer Science [cs]/Artificial Intelligence [cs.AI] - Abstract
International audience
- Published
- 2017
- Full Text
- View/download PDF
26. A Multiagent Planning Approach for Cooperative Patrolling with Non-Stationary Adversaries
- Author
-
Beynier, Aurélie, primary
- Published
- 2017
- Full Text
- View/download PDF
27. Optimization of Probabilistic Argumentation With Markov Decision Models
- Author
-
Hadoux, Emmanuel, Beynier, Aurélie, Maudet, Nicolas, Weng, Paul, Hunter, Anthony, Systèmes Multi-Agents (SMA), Laboratoire d'Informatique de Paris 6 (LIP6), Université Pierre et Marie Curie - Paris 6 (UPMC)-Centre National de la Recherche Scientifique (CNRS)-Université Pierre et Marie Curie - Paris 6 (UPMC)-Centre National de la Recherche Scientifique (CNRS), SYSU-CMU Joint Institute of Engineering, SYSU-CMU Shunde International Joint Research Institute, Department of Computer Science, University College of London [London] (UCL), ANR-10-BLAN-0215,LARDONS,Apprentissage et raisonnement pour la décision optimale selon des informations numériques et symboliques(2010), ANR-13-BS02-0004,AMANDE,Argumentation Multilatérale Avancée pour la DElibération(2013), Hadoux, Emmanuel, BLANC - Apprentissage et raisonnement pour la décision optimale selon des informations numériques et symboliques - - LARDONS2010 - ANR-10-BLAN-0215 - BLANC - VALID, and Blanc 2013 - Argumentation Multilatérale Avancée pour la DElibération - - AMANDE2013 - ANR-13-BS02-0004 - Blanc 2013 - VALID
- Subjects
[INFO.INFO-AI] Computer Science [cs]/Artificial Intelligence [cs.AI] ,[INFO.INFO-AI]Computer Science [cs]/Artificial Intelligence [cs.AI] - Abstract
International audience; One prominent way to deal with conflicting viewpoints among agents is to conduct an argumentative debate: by exchanging arguments, agents can seek to persuade each other. In this paper we investigate the problem, for an agent, of optimizing a sequence of moves to be put forward in a debate, against an opponent assumed to behave stochasti-cally, and equipped with an unknown initial belief state. Despite the prohibitive number of states induced by a naive mapping to Markov models, we show that exploiting several features of such interaction settings allows for optimal resolution in practice, in particular: (1) as debates take place in a public space (or common ground), they can readily be modelled as Mixed Observability Markov Decision Processes, (2) as argumentation problems are highly structured, one can design optimization techniques to prune the initial instance. We report on the experimental evaluation of these techniques.
- Published
- 2015
28. The Power of Swap Deals in Distributed Resource Allocation
- Author
-
Damamme, Anastasia, Beynier, Aurélie, Chevaleyre, Yann, Maudet, Nicolas, Systèmes Multi-Agents (SMA), Laboratoire d'Informatique de Paris 6 (LIP6), Université Pierre et Marie Curie - Paris 6 (UPMC)-Centre National de la Recherche Scientifique (CNRS)-Université Pierre et Marie Curie - Paris 6 (UPMC)-Centre National de la Recherche Scientifique (CNRS), Laboratoire d'Informatique de Paris-Nord (LIPN), Université Paris 13 (UP13)-Institut Galilée-Université Sorbonne Paris Cité (USPC)-Centre National de la Recherche Scientifique (CNRS), ANR-14-CE24-0007,CoCoRICo-CoDec,Calcul, Communication, Rationalité et Incitations en Décision Collective et Coopérative(2014), Maudet, Nicolas, and Appel à projets générique - Calcul, Communication, Rationalité et Incitations en Décision Collective et Coopérative - - CoCoRICo-CoDec2014 - ANR-14-CE24-0007 - Appel à projets générique - VALID
- Subjects
[INFO.INFO-AI] Computer Science [cs]/Artificial Intelligence [cs.AI] ,[INFO.INFO-AI]Computer Science [cs]/Artificial Intelligence [cs.AI] - Abstract
International audience; In the simple resource allocation setting consisting in assigning exactly one resource per agent, the top trading cycle procedure stands out as being the undisputed method of choice. It remains however a centralized procedure which may not well suited in the context of multiagent systems, where distributed coordination may be problematic. In this paper, we investigate the power of dynamics based on rational bilateral deals (swaps) in such settings. While they may induce a high efficiency loss, we provide several new elements that temper this fact: (i) we identify a natural domain where convergence to a Pareto-optimal allocation can be guaranteed, (ii) we show that the worst-case loss of welfare is as good as it can be under the assumption of individual rationality, (iii) we provide a number of experimental results, showing that such dynamics often provide good outcomes, especially in light of their simplicity, and (iv) we prove the NP-hardness of deciding whether an allocation maximizing utilitarian or egalitarian welfare is reachable.
- Published
- 2015
29. Sequential Decision-Making under Non-stationary Environments via Sequential Change-point Detection
- Author
-
Hadoux, Emmanuel, Beynier, Aurélie, Weng, Paul, Systèmes Multi-Agents (SMA), Laboratoire d'Informatique de Paris 6 (LIP6), Université Pierre et Marie Curie - Paris 6 (UPMC)-Centre National de la Recherche Scientifique (CNRS)-Université Pierre et Marie Curie - Paris 6 (UPMC)-Centre National de la Recherche Scientifique (CNRS), DECISION, ANR-10-BLAN-0215,LARDONS,Apprentissage et raisonnement pour la décision optimale selon des informations numériques et symboliques(2010), Hadoux, Emmanuel, and BLANC - Apprentissage et raisonnement pour la décision optimale selon des informations numériques et symboliques - - LARDONS2010 - ANR-10-BLAN-0215 - BLANC - VALID
- Subjects
[INFO.INFO-AI] Computer Science [cs]/Artificial Intelligence [cs.AI] ,[INFO.INFO-LG]Computer Science [cs]/Machine Learning [cs.LG] ,[INFO.INFO-LG] Computer Science [cs]/Machine Learning [cs.LG] ,[INFO.INFO-AI]Computer Science [cs]/Artificial Intelligence [cs.AI] - Abstract
International audience; Reinforcement Learning (RL) has been mainly interested in computing an optimal policy for an agent acting in a stationary environment. However, in many real world decision problems the assumption on the stationarity does not hold. One can view a non-stationary environment as a set of contexts (also called modes or modules) where a context corresponds to a possible stationary dynamics of the environment. Even most approaches assume that the number of modes is known, a RL method-Reinforcement Learning with Context Detection (RLCD)-has been recently proposed to learn an a pirori unknown set of contexts and detect context changes. In this paper, we propose a new approach by adapting the tools developed in statistics and more precisely in sequential analysis for detecting an environmental change. Our approach is thus more theoretically founded and necessitates less parameters than RLCD. We also show that our parameters are easier to interpret and therefore easier to tune. Finally, we show experimentally that our approach out-performs the current methods on several application problems.
- Published
- 2014
30. Allocation de ressources par échanges bilatéraux
- Author
-
Damamme, Anastasia, Beynier, Aurélie, Maudet, Nicolas, Systèmes Multi-Agents (SMA), Laboratoire d'Informatique de Paris 6 (LIP6), Université Pierre et Marie Curie - Paris 6 (UPMC)-Centre National de la Recherche Scientifique (CNRS)-Université Pierre et Marie Curie - Paris 6 (UPMC)-Centre National de la Recherche Scientifique (CNRS), and Publications, Lip6
- Subjects
[INFO]Computer Science [cs] ,[INFO] Computer Science [cs] - Abstract
National audience; Dans cet article, nous étudions des procédures décentralisées d'allocation de ressources reposant sur des échanges bilatéraux entre les agents. Nous nous intéressons aux problèmes dans lesquels chaque agent possède une unique ressource et est en mesure d'échanger cette ressource avec un autre agent afin d'augmenter sa satisfaction, les préférences d'un agent étant décrites par un ordre linéaire sur les ressources. Différentes approches se sont précédemment proposées de calculer de manière centralisée une solution optimale au sens de Pareto. Notre propos est d'étudier les propriétés des solutions obtenues par des procédures décentralisées. Malgré le fait que dans le pire cas, ces solutions puissent potentiellement être loin de l'optimalité, nous avançons plusieurs arguments permettant de relativiser ces résultats négatifs. Nous comparons également les solutions résultant d'échanges bilatéraux avec celles obtenues par la procédure centralisée Top Trading Cycle.
- Published
- 2014
31. Simulating Autonomous Pedestrians Navigation : A Generic Multi-Agent Model to Couple Individual and Collective Dynamics
- Author
-
Simo Kanmeugne, Patrick, Beynier, Aurélie, Systèmes Multi-Agents (SMA), Laboratoire d'Informatique de Paris 6 (LIP6), Université Pierre et Marie Curie - Paris 6 (UPMC)-Centre National de la Recherche Scientifique (CNRS)-Université Pierre et Marie Curie - Paris 6 (UPMC)-Centre National de la Recherche Scientifique (CNRS), and Simo Kanmeugne, Patrick
- Subjects
[INFO.INFO-AI] Computer Science [cs]/Artificial Intelligence [cs.AI] ,traffic ,pedestrian navigation ,coordination ,multi-agent simulation ,interaction ,[INFO.INFO-MO] Computer Science [cs]/Modeling and Simulation ,[INFO.INFO-MO]Computer Science [cs]/Modeling and Simulation ,[INFO.INFO-AI]Computer Science [cs]/Artificial Intelligence [cs.AI] - Abstract
International audience; In this paper, we focus on planning credible walking paths in real-time for a potentially highly congested crowd of au- tonomous pedestrians. For this purpose, we exploit the prin- ciple of least effort, applied to human navigation, which pos- tulates that credible behaviours emerge as a function of the organism's propensity to minimize metabolic energy expen- diture with respect to task, environment dynamics, and or- ganism's constraints to action. We therefore propose a consistent problem formulation for the navigation task where both individual and collective dynamics are taken into account. Each pedestrian is represented as a situated agent who tries to reach its destination by following energy efficient paths. Agents are autonomous, and at the same time, sub- ject to the environment dynamics. They interact with each other through the environment in order to estimate their en- ergy expenditure relatively to their tasks. Our formulation results in a generic and scalable multi-agent model, capable of simulating individual and collective behaviours regardless of the number of agents.
- Published
- 2014
32. Prise de décision séquentielle en environnements incertains et non stationnaires
- Author
-
Hadoux, Emmanuel, Beynier, Aurélie, Weng, Paul, Courbin-Coulaud, Martine, Systèmes Multi-Agents (SMA), Laboratoire d'Informatique de Paris 6 (LIP6), Université Pierre et Marie Curie - Paris 6 (UPMC)-Centre National de la Recherche Scientifique (CNRS)-Université Pierre et Marie Curie - Paris 6 (UPMC)-Centre National de la Recherche Scientifique (CNRS), DECISION, and Société française de recherche opérationnelle et d'aide à la décision
- Subjects
environnements non stationnaires ,[INFO.INFO-RO] Computer Science [cs]/Operations Research [cs.RO] ,décision séquentielle dans l'incertain ,[INFO.INFO-RO]Computer Science [cs]/Operations Research [cs.RO] - Abstract
International audience; Le modèle des Processus Décisionnels de Markov (MDP) (Puterman94) permet de représenter et de résoudre des problèmes de décision séquentielle dans l'incertain.Il suppose que l'environnement dans lequel les décisions sont prises est stationnaire.Cependant, dans la pratique, cela peut ne pas être le cas.Choi et al. ont proposé les Hidden-Mode MDP (HM-MDP) (Choi99) pour répondre à cette limitation.Dans leur nouveau modèle, l'environnement est supposé évoluer selon une chaîne de Markov. Chaque mode m d'un HM-MDP est un MDP défini par le tuple avec S l'ensemble des états, A l'ensemble des actions, T_m la fonction de transition entre les états et R_m la fonction de récompense. L'ensemble des états et l'ensemble des actions sont donc communs pour tous les modes. Un HM-MDP est alors défini par le tuple avec M l'ensemble des modes et C la fonction de transition entre les modes.Nous proposons les Hidden-Semi-Markov-Mode MDP (HS3MDP) comme extension des HM-MDP pour les cas où l'environnement évolue selon une chaîne semi-markovienne.Cette hypothèse est d'après nous plus réaliste car l'environnement n'évolue pas forcément à tous les pas de temps. Un HS3MDP est défini par un tuple avec M et C définis comme précédemment et la fonction H(m, m', h) indiquant la probabilité, après avoir changé de mode de m à m', de rester h pas de temps dans le nouveau mode m'. L'un des problèmes de la littérature est celui de la gestion d'ascenseurs. Dans ce problème, l'ensemble des états représente toutes les combinaisons possibles de positions des ascenseurs ainsi que de l'état des boutons d'appel (à l'intérieur) et de sélection d'étages (à l'extérieur). Les actions sont monter, descendre et ouvrir les portes. La fonction de transition entre les états est dépendante des probabilités d'arrivée de personnes à chacun des étages. Cette probabilité est modifiée en fonction des différentes heures de pointes, des réunions inattendues, etc. représentées par les modes. Les fonctions de récompenses engendrent un coup pour chaque utilisateur dont la requête n'est pas satisfaite. C et H sont définies suivant les dynamiques du problème.Les HM-MDP et les HS3MDP sont des sous-classes des MDP partiellement observables (Puterman94) et peuvent donc être résolus en utilisant les méthodes déjà existantes.Cependant, ils souffrent de la même malédiction de la dimension que les POMDP.Nous nous sommes donc intéressés à la résolution approchée des HS3MDP en utilisant POMCP (Silver10) l'un des meilleurs algorithmes de résolution approchée des POMDP à ce jour.Nous l'avons adapté en exploitant la strucutre particulière des HS3MDP afin d'en améliorer les performances et nous avons expérimenté POMCP original et adapté sur différents problèmes non stationnaires de la littérature.
- Published
- 2014
33. An Iterative Algorithm for Solving Constrained Decentralized Markov Decision Processes
- Author
-
Beynier, Aurélie, Mouaddib, Abdel-Illah, Groupe de Recherche en Informatique, Image et Instrumentation de Caen (GREYC), Centre National de la Recherche Scientifique (CNRS)-École Nationale Supérieure d'Ingénieurs de Caen (ENSICAEN), Normandie Université (NU)-Normandie Université (NU)-Université de Caen Normandie (UNICAEN), Normandie Université (NU), Equipe MAD - Laboratoire GREYC - UMR6072, Normandie Université (NU)-Centre National de la Recherche Scientifique (CNRS)-École Nationale Supérieure d'Ingénieurs de Caen (ENSICAEN), and Beynier, Aurélie
- Subjects
[INFO.INFO-AI] Computer Science [cs]/Artificial Intelligence [cs.AI] ,[INFO.INFO-MA]Computer Science [cs]/Multiagent Systems [cs.MA] ,[INFO.INFO-MA] Computer Science [cs]/Multiagent Systems [cs.MA] ,[INFO.INFO-AI]Computer Science [cs]/Artificial Intelligence [cs.AI] - Abstract
International audience; Despite the significant progress to extend Markov Decision Processes (MDP) to cooperative multi-agent systems, developing approaches that can deal with realistic problems remains a serious challenge. Existing approaches that solve Decentralized Markov Decision Processes (DEC-MDPs) suffer from the fact that they can only solve relatively small problems without complex constraints on task execution. OC-DEC-MDP has been introduced to deal with large DEC-MDPs under resource and temporal constraints. However, the proposed algorithm to solve this class of DEC-MDPs has some limits: it suffers from overestimation of opportunity cost and restricts policy improvement to one sweep (or iteration). In this paper, we propose to overcome these limits by first introducing the notion of Expected Opportunity Cost to better assess the influence of a local decision of an agent on the others. We then describe an iterative version of the algorithm to incrementally improve the policies of agents leading to higher quality solutions in some settings. Experimental results are shown to support our claims.
- Published
- 2006
34. Modèle microscopique à influence macroscopique pour la simulation des déplacements de piétons autonomes en temps réel
- Author
-
Simo Kanmeugne, Patrick, Beynier, Aurélie, Donnart, Jean-Yves, Thales Training and Simulation (TTS), Université Pierre et Marie Curie - Paris 6 (UPMC), Systèmes Multi-Agents (SMA), Laboratoire d'Informatique de Paris 6 (LIP6), and Université Pierre et Marie Curie - Paris 6 (UPMC)-Centre National de la Recherche Scientifique (CNRS)-Université Pierre et Marie Curie - Paris 6 (UPMC)-Centre National de la Recherche Scientifique (CNRS)
- Subjects
[INFO.INFO-MA]Computer Science [cs]/Multiagent Systems [cs.MA] ,[INFO.INFO-MO]Computer Science [cs]/Modeling and Simulation ,[INFO.INFO-AI]Computer Science [cs]/Artificial Intelligence [cs.AI] - Abstract
International audience; Cet article présente une nouvelle approche pour la simulation des déplacements de piétons autonomes en temps réel dans un environnement urbain. Partant du constat que les modèles actuels sont divisés entre représentation macroscopique et représentation microscopique du déplacement, nous proposons une approche posant le problème d'une manière plus générique afin de s'abstraire au maximum de ce clivage. Pour cela nous présentons un modèle microscopique à influence macroscopique qui tient conjointement compte de l'évolution du trafic et des interactions les plus élémentaires qui ont lieu lors du déplacement des piétons. Ces interactions sont le fruit des dépendances qui se créent naturellement entre les déplacements de piétons et qui influencent leurs plans. Les simulations que nous avons réalisées montrent des résultats encourageants aussi bien en termes de crédibilité que de temps de calcul.
- Published
- 2013
35. Multiagent Distributed Resource Allocation under Uncertainty
- Author
-
Beynier, Aurélie, Estivie, Sylvia, Systèmes Multi-Agents (SMA), Laboratoire d'Informatique de Paris 6 (LIP6), Université Pierre et Marie Curie - Paris 6 (UPMC)-Centre National de la Recherche Scientifique (CNRS)-Université Pierre et Marie Curie - Paris 6 (UPMC)-Centre National de la Recherche Scientifique (CNRS), Laboratoire d'Automatique, de Mécanique et d'Informatique industrielles et Humaines - UMR 8201 (LAMIH), Université de Valenciennes et du Hainaut-Cambrésis (UVHC)-Centre National de la Recherche Scientifique (CNRS), and Université de Valenciennes et du Hainaut-Cambrésis (UVHC)-Centre National de la Recherche Scientifique (CNRS)-INSA Institut National des Sciences Appliquées Hauts-de-France (INSA Hauts-De-France)
- Subjects
[INFO]Computer Science [cs] - Abstract
National audience; A resource allocation problem is a problem in which a set of agents - cooperative or not - must find an assignment of a set of resources over a set of consumers (most of the time, the agents themselves). This allocation must match, as best as possible, with the agents’ preferences, which are often antagonist. In most allocation problems, the solution space has a combinatorial structure that creates difficulties with the preference formal representation and the optimal choice calculation. Furthermore, agents must frequently make a decision with an incomplete knowledge of the system state while exogenous factors may affect this state after the decision. There is thus a need for the agents to handle uncertainty about the system in order to maximize their satisfaction. However, the allocation problem gets more complicated in case of uncertainty and usual models of collective resource allocation are not appropriate for this context. Whereas resource allocation models for combinatorial domains are the subjects of studies, none of these models consider uncertainty aspects in a distributed context. In this paper we propose a decision-theoretic approach that allows a set of agents to solve, in a distributed way, resource allocation problems under uncertainty. We represent possible interactions and limited observability as an interaction graph and we propose an MDP based approach to compute exchange strategies taking into account future interaction opportunities.
- Published
- 2013
36. Résolution approchée par décomposition de processus décisionnels de Markov appliquée à l'exploration en robotique mobile
- Author
-
Lozenguez, Guillaume, Adouane, Lounis, Beynier, Aurélie, Martinet, Philippe, Mouaddib, Abdel-Illah, École des Mines de Douai (Mines Douai EMD), Institut Mines-Télécom [Paris] (IMT), Institut Pascal (IP), SIGMA Clermont (SIGMA Clermont)-Université Clermont Auvergne [2017-2020] (UCA [2017-2020])-Centre National de la Recherche Scientifique (CNRS), Systèmes Multi-Agents (SMA), Laboratoire d'Informatique de Paris 6 (LIP6), Université Pierre et Marie Curie - Paris 6 (UPMC)-Centre National de la Recherche Scientifique (CNRS)-Université Pierre et Marie Curie - Paris 6 (UPMC)-Centre National de la Recherche Scientifique (CNRS), Institut de Recherche en Communications et en Cybernétique de Nantes (IRCCyN), Mines Nantes (Mines Nantes)-École Centrale de Nantes (ECN)-Ecole Polytechnique de l'Université de Nantes (EPUN), Université de Nantes (UN)-Université de Nantes (UN)-PRES Université Nantes Angers Le Mans (UNAM)-Centre National de la Recherche Scientifique (CNRS), Equipe MAD - Laboratoire GREYC - UMR6072, Groupe de Recherche en Informatique, Image et Instrumentation de Caen (GREYC), Centre National de la Recherche Scientifique (CNRS)-École Nationale Supérieure d'Ingénieurs de Caen (ENSICAEN), Normandie Université (NU)-Normandie Université (NU)-Université de Caen Normandie (UNICAEN), Normandie Université (NU)-Centre National de la Recherche Scientifique (CNRS)-École Nationale Supérieure d'Ingénieurs de Caen (ENSICAEN), Normandie Université (NU), Université de Caen Normandie (UNICAEN), Normandie Université (NU)-Normandie Université (NU)-École Nationale Supérieure d'Ingénieurs de Caen (ENSICAEN), Normandie Université (NU)-Centre National de la Recherche Scientifique (CNRS)-Université de Caen Normandie (UNICAEN), and Normandie Université (NU)-Centre National de la Recherche Scientifique (CNRS)
- Subjects
Mots-clés : Exploration ,[INFO.INFO-AU]Computer Science [cs]/Automatic Control Engineering ,[INFO.INFO-SY]Computer Science [cs]/Systems and Control [cs.SY] ,Processus Décisionnel de Markov et Décomposition ,[INFO.INFO-RB]Computer Science [cs]/Robotics [cs.RO] ,Robotique Mobile ,[SPI.AUTO]Engineering Sciences [physics]/Automatic ,[INFO.INFO-AI]Computer Science [cs]/Artificial Intelligence [cs.AI] - Abstract
International audience; Dans cet article, nous nous intéressons à l'exploration d'une zone par un robot mobile au-tonome. Notre approche procède à des re-calculs réguliers des politiques en utilisant des processus décisionnels de Markov, au fur et à mesure que la connaissance du robot est actualisée. Dans la mesure où, l'exploration conduit, à chaque instant, à une explosion combinatoire des possibilités sur les poli-tiques d'actions. Le problème de planification par résolution d'un MDP large décomposé est soulevé avec une contrainte forte sur la rapidité des calculs mis en oeuvre. L'approche proposée cherche à par-titionner l'espace des états du robot de façon à construire, ensuite, une hiérarchie de MDP : un MDP abstrait haut niveau et plusieurs MDPs locaux aux régions construites. L'approche est ensuite évaluée par plusieurs expérimentations statistiques. L'originalité consiste en la capacité de l'agent à hiérarchiser l'intérêt de chaque zone à explorer relativement à toutes les autres pour optimiser la politique construite à chaque modification de la carte.
- Published
- 2013
37. Optimizing distributed resource exchanges in multiagent systems under uncertainty
- Author
-
Beynier, Aurélie, Estivie, Sylvia, Systèmes Multi-Agents (SMA), Laboratoire d'Informatique de Paris 6 (LIP6), Université Pierre et Marie Curie - Paris 6 (UPMC)-Centre National de la Recherche Scientifique (CNRS)-Université Pierre et Marie Curie - Paris 6 (UPMC)-Centre National de la Recherche Scientifique (CNRS), Laboratoire d'Automatique, de Mécanique et d'Informatique industrielles et Humaines - UMR 8201 (LAMIH), Université de Valenciennes et du Hainaut-Cambrésis (UVHC)-Centre National de la Recherche Scientifique (CNRS)-INSA Institut National des Sciences Appliquées Hauts-de-France (INSA Hauts-De-France), and Université de Valenciennes et du Hainaut-Cambrésis (UVHC)-Centre National de la Recherche Scientifique (CNRS)
- Subjects
[INFO]Computer Science [cs] - Abstract
International audience; A resource allocation problem is a problem in which a set of agents - cooperative or not - must find an assignment of a set of resources. This allocation must match, as best as possible, with the agents’ preferences, which are often antagonist. In most allocation problems, the solution space has a combinatorial structure that creates difficulties with the preference formal representation and the optimal choice calculation. Furthermore, agents must frequently make a decision with an incomplete knowledge of the system state while exogenous factors may affect this state after the decision. There is thus a need for the agents to handle uncertainty about the system in order to maximize their satisfaction. However, the allocation problem gets more complicated in case of uncertainty and usual models of collective resource allocation are not appropriate for this context. Whereas resource allocation models for combinatorial domains are the subject of studies, none of these models consider uncertainty aspects in a distributed context. In this paper, we propose a decision-theoretic approach that allows a set of agents to solve, in a distributed way, resource allocation problems under uncertainty. We represent possible interactions and limited observability as an interaction graph and we propose an MDP based approach to compute exchange strategies taking into account future interaction opportunities.
- Published
- 2013
38. Apprentissage de politique par minimisation de regret
- Author
-
Hadoux, Emmanuel, Beynier, Aurélie, Weng, Paul, Systèmes Multi-Agents (SMA), Laboratoire d'Informatique de Paris 6 (LIP6), Université Pierre et Marie Curie - Paris 6 (UPMC)-Centre National de la Recherche Scientifique (CNRS)-Université Pierre et Marie Curie - Paris 6 (UPMC)-Centre National de la Recherche Scientifique (CNRS), DECISION, and Publications, Lip6
- Subjects
[INFO]Computer Science [cs] ,[INFO] Computer Science [cs] - Abstract
National audience; Les processus décisionnels de Markov sont des modèles couramment utilisés pour représenter des problèmes dedécisions séquentielles dans l'incertain. Cependant, les méthodes de résolution existantes font les hypothèses destationnarité et de représentabilité de la fonction de transition par des probabilités. Nous proposons de retirer ceshypothèses en utilisant l'apprentissage par minimisation de regret dans le cadre multi‐états, mono et multi‐agents.
- Published
- 2013
39. Simulation de déplacements en milieu urbain à l'aide d'un module sémantique
- Author
-
Harkouken, Kenza, Simo Kanmeugne, Patrick, Sabouret, Nicolas, Beynier, Aurélie, Systèmes Multi-Agents (SMA), Laboratoire d'Informatique de Paris 6 (LIP6), Université Pierre et Marie Curie - Paris 6 (UPMC)-Centre National de la Recherche Scientifique (CNRS)-Université Pierre et Marie Curie - Paris 6 (UPMC)-Centre National de la Recherche Scientifique (CNRS), Projet Terra Dynamica, and Harkouken, Kenza
- Subjects
[INFO.INFO-AI] Computer Science [cs]/Artificial Intelligence [cs.AI] ,représentation des connaissances et raisonnement ,environnements virtuels sémantiques ,path-finding ,carte de navigation ,Simulation multi-agents ,[INFO.INFO-AI]Computer Science [cs]/Artificial Intelligence [cs.AI] - Abstract
National audience; Les travaux présentés dans cet article ont pour but de simuler les déplacements de piétons dans une ville virtuelle, en temps réel, et de manière crédible pour un observateur extérieur. Nous présentons un moteur de simulation qui comprend un module de navigation et un module sémantique. Le module de navigation s'appuiera sur des règles de raisonnement fournies par le module sémantique. Ces règles permettront, entre autre, d'inférer un "facteur de danger" qui sera exploité par les algorithmes de déplacement. Notre objectif est de mesurer l'apport d'un module sémantique pour le calcul de courts déplacements des piétons dans un environnement urbain tout en mettant l'accent sur leurs interactions avec les véhicules afin de rendre le comportement plus crédible. Nous présentons tout d'abord l'architecture générale de notre moteur de simulation, qui se compose d'un module de représentation des informations sémantiques de l'environnement et d'un module de navigation pour le déplacement des piétons. Par la suite, nous décrivons l'implémentation qui nous a permis d'évaluer notre modèle.
- Published
- 2011
40. A Decision-Theoretic Approach to Cooperative Control and Adjustable Autonomy
- Author
-
Mouaddib, Abdel-Illah, Zilberstein, Shlomo, Beynier, Aurélie, Jeanpierre, Laurent, Equipe MAD - Laboratoire GREYC - UMR6072, Groupe de Recherche en Informatique, Image et Instrumentation de Caen (GREYC), Centre National de la Recherche Scientifique (CNRS)-École Nationale Supérieure d'Ingénieurs de Caen (ENSICAEN), Normandie Université (NU)-Normandie Université (NU)-Université de Caen Normandie (UNICAEN), Normandie Université (NU)-Centre National de la Recherche Scientifique (CNRS)-École Nationale Supérieure d'Ingénieurs de Caen (ENSICAEN), Normandie Université (NU), Systèmes Multi-Agents (SMA), Laboratoire d'Informatique de Paris 6 (LIP6), Université Pierre et Marie Curie - Paris 6 (UPMC)-Centre National de la Recherche Scientifique (CNRS)-Université Pierre et Marie Curie - Paris 6 (UPMC)-Centre National de la Recherche Scientifique (CNRS), Université de Caen Normandie (UNICAEN), Normandie Université (NU)-Normandie Université (NU)-École Nationale Supérieure d'Ingénieurs de Caen (ENSICAEN), Normandie Université (NU)-Centre National de la Recherche Scientifique (CNRS)-Université de Caen Normandie (UNICAEN), and Normandie Université (NU)-Centre National de la Recherche Scientifique (CNRS)
- Subjects
[INFO.INFO-MA]Computer Science [cs]/Multiagent Systems [cs.MA] ,[INFO.INFO-MO]Computer Science [cs]/Modeling and Simulation ,ComputingMilieux_MISCELLANEOUS ,[INFO.INFO-AI]Computer Science [cs]/Artificial Intelligence [cs.AI] - Abstract
International audience
- Published
- 2010
- Full Text
- View/download PDF
41. Punctual versus continuous auction coordination for multi-robot and multi-task topological navigation
- Author
-
Lozenguez, Guillaume, primary, Adouane, Lounis, additional, Beynier, Aurélie, additional, Mouaddib, Abdel-Illah, additional, and Martinet, Philippe, additional
- Published
- 2015
- Full Text
- View/download PDF
42. DEC-MDP / DEC-POMDP
- Author
-
Beynier, Aurélie, Charpillet, François, Szer, Daniel, Mouaddib, Abdel-Illah, Référent, Greyc, Olivier Buffet, Olivier Sigaud, Systèmes Multi-Agents (SMA), Laboratoire d'Informatique de Paris 6 (LIP6), Université Pierre et Marie Curie - Paris 6 (UPMC)-Centre National de la Recherche Scientifique (CNRS)-Université Pierre et Marie Curie - Paris 6 (UPMC)-Centre National de la Recherche Scientifique (CNRS), Autonomous intelligent machine (MAIA), Inria Nancy - Grand Est, Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Department of Complex Systems, Artificial Intelligence & Robotics (LORIA - AIS), Laboratoire Lorrain de Recherche en Informatique et ses Applications (LORIA), Institut National de Recherche en Informatique et en Automatique (Inria)-Université de Lorraine (UL)-Centre National de la Recherche Scientifique (CNRS)-Institut National de Recherche en Informatique et en Automatique (Inria)-Université de Lorraine (UL)-Centre National de la Recherche Scientifique (CNRS)-Laboratoire Lorrain de Recherche en Informatique et ses Applications (LORIA), Institut National de Recherche en Informatique et en Automatique (Inria)-Université de Lorraine (UL)-Centre National de la Recherche Scientifique (CNRS)-Université de Lorraine (UL)-Centre National de la Recherche Scientifique (CNRS), INRIA Lorraine, Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Laboratoire Lorrain de Recherche en Informatique et ses Applications (LORIA), Centre National de la Recherche Scientifique (CNRS)-Institut National Polytechnique de Lorraine (INPL)-Université Nancy 2-Université Henri Poincaré - Nancy 1 (UHP)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Institut National Polytechnique de Lorraine (INPL)-Université Nancy 2-Université Henri Poincaré - Nancy 1 (UHP), Equipe MAD - Laboratoire GREYC - UMR6072, Groupe de Recherche en Informatique, Image et Instrumentation de Caen (GREYC), Centre National de la Recherche Scientifique (CNRS)-École Nationale Supérieure d'Ingénieurs de Caen (ENSICAEN), Normandie Université (NU)-Normandie Université (NU)-Université de Caen Normandie (UNICAEN), Normandie Université (NU)-Centre National de la Recherche Scientifique (CNRS)-École Nationale Supérieure d'Ingénieurs de Caen (ENSICAEN), Normandie Université (NU), Institut National de Recherche en Informatique et en Automatique (Inria)-Université Henri Poincaré - Nancy 1 (UHP)-Université Nancy 2-Institut National Polytechnique de Lorraine (INPL)-Centre National de la Recherche Scientifique (CNRS)-Université Henri Poincaré - Nancy 1 (UHP)-Université Nancy 2-Institut National Polytechnique de Lorraine (INPL)-Centre National de la Recherche Scientifique (CNRS), Université de Caen Normandie (UNICAEN), Normandie Université (NU)-Normandie Université (NU)-École Nationale Supérieure d'Ingénieurs de Caen (ENSICAEN), Normandie Université (NU)-Centre National de la Recherche Scientifique (CNRS)-Université de Caen Normandie (UNICAEN), and Normandie Université (NU)-Centre National de la Recherche Scientifique (CNRS)
- Subjects
[INFO.INFO-AI] Computer Science [cs]/Artificial Intelligence [cs.AI] ,Dec-POMDP ,[INFO.INFO-MA]Computer Science [cs]/Multiagent Systems [cs.MA] ,MathematicsofComputing_NUMERICALANALYSIS ,Dec-MDP ,[INFO.INFO-MO] Computer Science [cs]/Modeling and Simulation ,[INFO.INFO-MA] Computer Science [cs]/Multiagent Systems [cs.MA] ,[INFO.INFO-MO]Computer Science [cs]/Modeling and Simulation ,ComputingMethodologies_ARTIFICIALINTELLIGENCE ,decentralized Markov decision processes ,[INFO.INFO-AI]Computer Science [cs]/Artificial Intelligence [cs.AI] ,Markov decision processes - Abstract
International audience; Markov Decision Processes (MDPs) are a mathematical framework for modeling sequential decision problems under uncertainty as well as Reinforcement Learning problems. Written by experts in the field, this book provides a global view of current research using MDPs in Artificial Intelligence. It starts with an introductory presentation of the fundamental aspects of MDPs (planning in MDPs, Reinforcement Learning, Partially Observable MDPs, Markov games and the use of non-classical criteria). Then it presents more advanced research trends in the domain and gives some concrete examples using illustrative applications.
- Published
- 2010
43. Mixed-Initiative Decision Theoretic Planning for Cooperative Control
- Author
-
Mouaddib, Abdel-Illah, Zilberstein, Shlomo, Beynier, Aurélie, Systèmes Multi-Agents (SMA), Laboratoire d'Informatique de Paris 6 (LIP6), Université Pierre et Marie Curie - Paris 6 (UPMC)-Centre National de la Recherche Scientifique (CNRS)-Université Pierre et Marie Curie - Paris 6 (UPMC)-Centre National de la Recherche Scientifique (CNRS), and Publications, Lip6
- Subjects
[INFO]Computer Science [cs] ,[INFO] Computer Science [cs] - Abstract
National audience; Mixed-initiative cooperative control can help overcome the limitations of autonomous robots by introducing a human operator into the control loop. Developing new computational models for cooperative control presents several key questions : how to account for the different perceptual and action abilities of the robot versus the human operator, the different costs of their actions, and the fact that human operators cannot switch their attention and take over control instantly. We present a decision-theoretic approach to solve these problems using Mixed-Initiative Markov Decision Processes (MI-MDPs). This framework allows us to compute optimal plans that not only tell the robot what actions to perform, but also when to request human attention or transfer control to the human operator. The result is a model with a varying degree of autonomy, particularly suitable for robots exploring a domain with regions that are too complex or risky for autonomous operation. Experimental results confirm the effectiveness of this approach in common scenarios in which fully-autonomous operation or continuous human control are both undesirable.
- Published
- 2009
44. Dec-MDP/POMDP
- Author
-
Beynier, Aurélie, Charpillet, François, Szer, Daniel, Mouaddib, Abdel-Illah, Laboratoire d'Informatique de Paris 6 (LIP6), Université Pierre et Marie Curie - Paris 6 (UPMC)-Centre National de la Recherche Scientifique (CNRS), Autonomous intelligent machine (MAIA), INRIA Lorraine, Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Laboratoire Lorrain de Recherche en Informatique et ses Applications (LORIA), Centre National de la Recherche Scientifique (CNRS)-Institut National Polytechnique de Lorraine (INPL)-Université Nancy 2-Université Henri Poincaré - Nancy 1 (UHP)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Institut National Polytechnique de Lorraine (INPL)-Université Nancy 2-Université Henri Poincaré - Nancy 1 (UHP), Equipe MAD - Laboratoire GREYC - UMR6072, Groupe de Recherche en Informatique, Image et Instrumentation de Caen (GREYC), Centre National de la Recherche Scientifique (CNRS)-École Nationale Supérieure d'Ingénieurs de Caen (ENSICAEN), Normandie Université (NU)-Normandie Université (NU)-Université de Caen Normandie (UNICAEN), Normandie Université (NU)-Centre National de la Recherche Scientifique (CNRS)-École Nationale Supérieure d'Ingénieurs de Caen (ENSICAEN), Normandie Université (NU), and O. Buffet and O. Sigaud
- Subjects
Dec-POMDP ,[INFO.INFO-LG]Computer Science [cs]/Machine Learning [cs.LG] ,Dec-MDP ,decentralized Markov decision processes ,Markov decision processes ,[INFO.INFO-AI]Computer Science [cs]/Artificial Intelligence [cs.AI] - Published
- 2008
45. Une contribution à la résolution des processus décisionnels de Markov décentralisés avec contraintes temporelles
- Author
-
Beynier, Aurélie, Groupe de Recherche en Informatique, Image et Instrumentation de Caen (GREYC), Centre National de la Recherche Scientifique (CNRS)-École Nationale Supérieure d'Ingénieurs de Caen (ENSICAEN), Normandie Université (NU)-Normandie Université (NU)-Université de Caen Normandie (UNICAEN), Normandie Université (NU), Université de Caen, Mouaddib, and System, HAL
- Subjects
Intelligence Artificielle ,Robotique collective ,Informatics ,Processus Décisionnels de Markov ,Systèmes multi-agents ,[SCCO.COMP] Cognitive science/Computer science ,Planification sous incertitude ,[SCCO.COMP]Cognitive science/Computer science - Abstract
This thesis deals with distributed multiagent decision-making underuncertainty. We formalize this problem with Decentralized MarkovDecision Processes (DEC-MDP) which extends Markov Decision Processes(MDP) to multi-agent settings. Even if DEC-MDPs describe an expressiveframework for cooperative multiagent decision, they suffer from a highcomplexity and fail to formalize constraints on task execution.Despite the wide variety of approaches to solve DEC-MDPs, computinga solution for large problems remains a serious challenge even forapproximation approaches.We develop an approach that can solve large problems, and that candeal with more complex time and action representations. We thereforedefine a class of DEC-MDP, OC-DEC-MDP, that allows us to considerseveral possible durations for each task taking into accountconstraints on task execution. Having considered the representationof the problems we deal with, we turn to OC-DEC-MDP resolution. Ourpurpose is to develop an efficient planning approach that computeseach agent's policy even for large missions. Given the highcomplexity of finding an optimal solution, we aim at computing anapproximate solution. We also split the multiagent decision probleminto a set of MDPs. For purposes of coordinating the agents, we thenintroduce the notion of Opportunity Cost., Cette thèse porte sur la prise de décision distribuée dans dessystèmes multi-agents agissant sous incertitude (les colonies derobots autonomes par exemple). Les processus décisionnels de MarkovDécentralisés décrivent un formalisme mathématique permettant demodéliser et de résoudre de tels problèmes. Leur utilisation pour laplanification des tâches dans des applications réelles posetoutefois quelques difficultés. Le modèle usuel des DEC-MDPs nepermet par exemple pas la prise en compte de contraintes sur l'exécution des tâches. De plus,la complexité de leur résolution est telle qu'il est difficile de déterminer une solution optimale excepté pour de petits problèmes.Le travail que nous présentons dans cette thèse a pour premier objectifd'adapter le modèle des DEC-MDPs afin de proposer une modélisationadéquate du temps et des actions, et de permettre la représentation deproblèmes réels. Nous décrivons ainsi une nouvelle classe deDEC-MDPs : les OC-DEC-MDPs (DEC-MDP avec Coût Occasionné). Dans un second temps,nous nous intéressons à leur résolution. Nous proposons différentsalgorithmes procédant à la planification des tâches de chaque agenten vue d'une prise de décision décentralisée et autonome, en accordavec les contraintes du problème. Afin de développer des algorithmesefficaces et de traiter des problèmes de taille importante, nous recherchons uneapproximation de la solution optimale. Nous procédonségalement à un découpage du problème initial en un ensemble de MDPs,et introduisons la notion de coût occasionné afin de tenir comptedes interactions entre les agents et de calculer des politiquescoopératives.
- Published
- 2006
46. Applications of DEC-MDPs in Multi-Robot Systems
- Author
-
Beynier, Aurélie, primary and Mouaddib, Abdel-Illah, additional
- Full Text
- View/download PDF
47. Decentralized Markov Decision Processes for Handling Temporal and Resource constraints in a Multiple Robot System
- Author
-
Beynier, Aurélie, primary and Mouaddib, Abdel-Illah, additional
- Full Text
- View/download PDF
48. Towards real-time credible and scalable agent-based simulations of autonomous pedestrians navigation
- Author
-
Kanmeugne, Patrick Simo, primary and Beynier, Aurélie, additional
- Published
- 2014
- Full Text
- View/download PDF
49. Map partitioning to approximate an exploration strategy in mobile robotics
- Author
-
Lozenguez, Guillaume, primary, Adouane, Lounis, additional, Beynier, Aurélie, additional, Mouaddib, Abdel-Illah, additional, and Martinet, Philippe, additional
- Published
- 2012
- Full Text
- View/download PDF
50. Solving efficiently Decentralized MDPs with temporal and resource constraints
- Author
-
Beynier, Aurélie, primary and Mouaddib, Abdel-Illah, additional
- Published
- 2010
- Full Text
- View/download PDF
Catalog
Discovery Service for Jio Institute Digital Library
For full access to our library's resources, please sign in.