/ プログラム / 発表一覧 / 著者一覧 / jsai2008 ホーム

2A1-03 強化学習のためのParticle Filterを用いた連続行動空間表現

6月12日(木) 09:00〜10:20 A会場
強化学習1

演題番号2A1-03
題目強化学習のためのParticle Filterを用いた連続行動空間表現
著者柏村 洋平 (大阪市立大学大学院 工学研究科 電子情報系専攻)
上野 敦志 (大阪市立大学大学院 工学研究科 電子情報系専攻)
辰巳 昭治 (大阪市立大学 大学院工学研究科)
時間6月12日(木) 09:40〜10:00
概要連続行動空間を持つエージェントでは,連続行動空間で行動学習を行うことにより,精密な行動制御が可能になることが期待できる.本研究では,行動空間をParticle Filterを用いて表現することで,連続行動空間中での強化学習を実現する.
論文PDFファイル

/ プログラム / 発表一覧 / 著者一覧 / jsai2008 ホーム