/ プログラム / 発表一覧 / 著者一覧 / jsai2008 ホーム

2A1 強化学習1

6月12日(木) 09:00〜10:20 A会場
Chair 近藤敏之,Com 末田直道 (松井)

発表一覧

題目 2A1-01 Q値累積型モンテカルロ法に関する一考察
著者 植村 渉 (龍谷大学)
論文 PDFファイル

題目 2A1-02 A Stepwise Training Method for Complex Task Solving Using Reinforcement Learning
著者 キム マーガレット ((株)ホンダ・リサーチ・インスティチュート・ジャパン)
金 天海 ((株)ホンダ・リサーチ・インスティチュート・ジャパン)
竹内 誉羽 ((株)ホンダ・リサーチ・インスティチュート・ジャパン)
辻野 広司 ((株)ホンダ・リサーチ・インスティチュート・ジャパン)
論文 PDFファイル

題目 2A1-03 強化学習のためのParticle Filterを用いた連続行動空間表現
著者 柏村 洋平 (大阪市立大学大学院 工学研究科 電子情報系専攻)
上野 敦志 (大阪市立大学大学院 工学研究科 電子情報系専攻)
辰巳 昭治 (大阪市立大学 大学院工学研究科)
論文 PDFファイル

題目 2A1-04 報酬の遅れが大きい状況下での強化学習の学習速度の検討
著者 伊丹 英樹 (京都工芸繊維大学 大学院工芸科学研究科)
板舛 尚樹 (京都工芸繊維大学 大学院工芸科学研究科)
岡 夏樹 (京都工芸繊維大学 大学院工芸科学研究科)
論文 PDFファイル




/ プログラム / 発表一覧 / 著者一覧 / jsai2008 ホーム