/ プログラム / 発表一覧 / 著者一覧 / jsai2008 ホーム

2A1　強化学習1

6月12日(木) 09:00～10:20　A会場
Chair 近藤敏之，Com 末田直道（松井）

発表一覧

題目	2A1-01　Ｑ値累積型モンテカルロ法に関する一考察
著者	植村渉 (龍谷大学)
論文	PDFファイル

題目	2A1-02　A Stepwise Training Method for Complex Task Solving Using Reinforcement Learning
著者	キムマーガレット (（株）ホンダ・リサーチ・インスティチュート・ジャパン) 金天海 (（株）ホンダ・リサーチ・インスティチュート・ジャパン) 竹内誉羽 (（株）ホンダ・リサーチ・インスティチュート・ジャパン) 辻野広司 ((株)ホンダ・リサーチ・インスティチュート・ジャパン)
論文	PDFファイル

題目	2A1-03　強化学習のためのParticle Filterを用いた連続行動空間表現
著者	柏村洋平 (大阪市立大学大学院　工学研究科　電子情報系専攻) 上野敦志 (大阪市立大学大学院　工学研究科　電子情報系専攻) 辰巳昭治 (大阪市立大学大学院工学研究科)
論文	PDFファイル

題目	2A1-04　報酬の遅れが大きい状況下での強化学習の学習速度の検討
著者	伊丹英樹 (京都工芸繊維大学大学院工芸科学研究科) 板舛尚樹 (京都工芸繊維大学大学院工芸科学研究科) 岡夏樹 (京都工芸繊維大学大学院工芸科学研究科)
論文	PDFファイル

/ プログラム / 発表一覧 / 著者一覧 / jsai2008 ホーム