/ プログラム/ 発表一覧/ 著者一覧企業展示一覧/ jsai2014ホーム /

1D3-4 POMDP環境下での強化学習におけるGAによるサブゴールの動的生成

*セッションの無断動画配信はご遠慮下さい。

Tweet #jsai2014 このエントリーをはてなブックマークに追加

05月12日(Mon) 13:20〜15:00 D会場(48人-ひめぎんホール 第3会議室)
1D3 「遺伝的アルゴリズムによる学習」

演題番号1D3-4
題目POMDP環境下での強化学習におけるGAによるサブゴールの動的生成
著者野村 拓己(名古屋工業大学情報工学科)
加藤 昇平(名古屋工業大学大学院 工学研究科 情報工学専攻)
時間05月12日(Mon) 14:20〜14:40
概要強化学習において常に完全な観測情報を獲得するとは限らず,異なる状態を同一の状態と知覚する問題がある.従来手法ではサブゴールを生成することでこの問題を解決したが,サブゴール数を予め与える必要があり,また得られる解は1つであり,環境変化に脆弱である.本研究では,GAにより可変数のサブゴールを動的に生成した.実験により適切なサブゴール数,複数の解を生成し,本研究の有効性を示した.
論文PDFファイル