演題番号 | 2A1-03 |
---|---|
題目 | 強化学習のためのParticle Filterを用いた連続行動空間表現 |
著者 | 柏村 洋平 (大阪市立大学大学院 工学研究科 電子情報系専攻) 上野 敦志 (大阪市立大学大学院 工学研究科 電子情報系専攻) 辰巳 昭治 (大阪市立大学 大学院工学研究科) |
時間 | 6月12日(木) 09:40〜10:00 |
概要 | 連続行動空間を持つエージェントでは,連続行動空間で行動学習を行うことにより,精密な行動制御が可能になることが期待できる.本研究では,行動空間をParticle Filterを用いて表現することで,連続行動空間中での強化学習を実現する. |
論文 | PDFファイル |