1. 強化学習を用いたターン制RPGのステージ自動生成
- Subjects
面白さモデル ,ロールプレイングゲーム ,procedural content generation ,ComputingMilieux_PERSONALCOMPUTING ,強化学習 ,ステージ生成 - Abstract
ターン制RPGはドラゴンクエストシリーズ等で有名なゲームジャンルで,様々な強さを持つ複数の敵グループを工夫しながら撃破していくことが中心的課題である.簡単すぎず難しすぎず,工夫や努力が報われるように敵味方のパラメータのバランス調整を行う事はゲームの面白さにとって大変重要である.近年ではプレイヤの飽きを防ぐために毎回ランダムにステージを生成することも行われ,そうなるとプロのデザイナの代わりにコンピュータにバランス調整を行わせる必要がある.従来良く使われるSearch-based PCGにはオンライン生成に向かないという制約があるため,本研究では強化学習の枠組みを試みる.未完成のステージを状態,次に戦わせる敵グループを行動として,ステージが完成したらその良さを報酬として与える.学習後は任意の未完成ステージについて良いステージを高速で完成させられるという狙いである.本論文では非常に単純化した環境において,特定の目的プレイ勝率を与えた場合に誤差5%程度のステージを作成できるような強化学習に成功した.:Turn-based RPG is a game genre which is famous as Dragon Quest series, and it has a main goal which is defeating many enemy groups with diverse strong considering many strategies. It is very important for entertainment of a game to balance the parameters of player and enemy, not so easy and not so hard or rewarding player's effort. Recently in order to keep players not be bored, some RPGs generate random stages at every playing times, to do that it is needed to adjust parameters by computer instead of pro-designers. In this research, we tested a reinforcement learning method, because Search-based PCG which is often used conventionally is not suitable for online generation. We considered reinforcement learning elements like "incomplete stage as a state", "next battle parameters as an action", "evaluation goodness of complete stage as the reward". After finishing learning, it will be possible to generate good stages quickly, when given random incomplete stages. In this paper, we succeeded to create a stage with about 5% error when giving a specific target winning rate, in very simplified environment.
- Published
- 2018