/ プログラム / 発表一覧 / 著者一覧 / jsai2008 ホーム

2A1-01 Q値累積型モンテカルロ法に関する一考察

6月12日(木) 09:00〜10:20 A会場
強化学習1

演題番号2A1-01
題目Q値累積型モンテカルロ法に関する一考察
著者植村 渉 (龍谷大学)
時間6月12日(木) 09:00〜09:20
概要経験強化型の強化学習法であるProfit Sharingが,マルコフ決定過程の確率的状態遷移に対して適切に学習を進めることができない場合があることを指摘し,モンテカルロ法の評価値の扱い方を基にした新しい学習方法を提案する.
論文PDFファイル

/ プログラム / 発表一覧 / 著者一覧 / jsai2008 ホーム