/
プログラム
/
発表一覧
/
著者一覧
/
jsai2008 ホーム
2A1-01 Q値累積型モンテカルロ法に関する一考察
6月12日(木) 09:00〜10:20 A会場
強化学習1
演題番号
2A1-01
題目
Q値累積型モンテカルロ法に関する一考察
著者
植村 渉
(龍谷大学)
時間
6月12日(木) 09:00〜09:20
概要
経験強化型の強化学習法であるProfit Sharingが,マルコフ決定過程の確率的状態遷移に対して適切に学習を進めることができない場合があることを指摘し,モンテカルロ法の評価値の扱い方を基にした新しい学習方法を提案する.
論文
PDFファイル
/
プログラム
/
発表一覧
/
著者一覧
/
jsai2008 ホーム