タイトル | マルコフ決定過程で表現されたロールプレイングゲームにおける攻略法の能動学習 |
---|---|
著者 | 前田康成 、後藤文太朗 、升井洋志 、桝井文人 、鈴木正清 、松嶋敏泰 |
年度 | 2013 |
形式 | 論文誌 |
分野 | 知識情報処理 |
掲載雑誌名 | バイオメディカル・ファジィ・システム学会誌 |
掲載号・ページ | vol.15, no.1, pp.69-81 |
掲載年 | 2013 |
掲載月 | 6 |
アブスト (日本語) |
査読有 DOIなし 従来からマルコフ決定過程(MDP)を用いたロールプレイングゲーム(RPG)のモデル化が行われている.しかし,RPGの攻略法を能動的に学習する研究は行われていない.そこで,本研究では,真のパラメータが未知のMDPで表現されたRPGにおける期待総利得をベイズ基準のもとで最大にする攻略法を求める能動的な学習方法を提案する.シミュレーションをとおして,提案方法の有効性を確認する. |
アブスト (英語) |
In previous research a role-playing game(RPG) is represented with Markov decision processes(MDP). But active learning method for RPG has not been studied yet. In this research we propose an active learning method which maximizes an expected total reward with respect to a Bayes criterion under the condition that the true parameter of MDP is unknown. We recognize the effectiveness of our proposed method by some simulations. |
備考 (日本語) |
3 |
備考 (英語) |
3 |
論文原稿 | |
発表資料 |
関連論文
- 拡張直交配列を用いた混合水準の実験計画法に関する一考察
- 半教師付き学習における一致性を満たすゆう度方程式の解に基づく予測の漸近評価
- A CLASS OF NOISELESS CODES DESIGNED BY DECISION THEORY
- 相互情報量最大に基準を置くユーザインタフェースの効率化
- パターンごと・ステージごとに事後確率のしきい値をおくストッピングルール
- MDLの帰納推論への応用
- 信頼性を考慮した推論について
- 推論の信頼性を考慮した不確実な知識の表現法と推論法について
- 特集にあたって
- ベイズ決定理論に基づく統計的モデル選択について
- Berlekamp-Masseyアルゴリズムを用いたBCH限界を超える復号法の計算量について
- BCH限界を超える復号法とその軟判定復号法への応用
- BCH限界を超える復号アルゴリズムを用いた2元BCH符号の軟判定復号法
- 事前分布が異なる場合のMDL原理に基づく符号とベイズ符号の符号長に関する解析
- 木符号におけるリスト復号法を用いた判定帰還方式について
- 損失関数を考慮した拡張事後密度の漸近正規性
- ゆう度比検定を用いた木符号の復号法について
- ビタビアルゴリズムを用いた可変サイズのリスト復号における誤り指数について
- ブロックターボ符号のインタリーバ構成法と最小距離
- あいまいな命題を含む推論モデルに関する一考察