2A1-03　強化学習のためのParticle Filterを用いた連続行動空間表現

6月12日(木) 09:00～10:20　A会場
強化学習1

演題番号	2A1-03
題目	強化学習のためのParticle Filterを用いた連続行動空間表現
著者	柏村洋平 (大阪市立大学大学院　工学研究科　電子情報系専攻) 上野敦志 (大阪市立大学大学院　工学研究科　電子情報系専攻) 辰巳昭治 (大阪市立大学大学院工学研究科)
時間	6月12日(木) 09:40～10:00
概要	連続行動空間を持つエージェントでは，連続行動空間で行動学習を行うことにより，精密な行動制御が可能になることが期待できる．本研究では，行動空間をParticle Filterを用いて表現することで，連続行動空間中での強化学習を実現する．
論文	PDFファイル