題目 | 2A1-01 Q値累積型モンテカルロ法に関する一考察 |
---|---|
著者 | 植村 渉 (龍谷大学) |
論文 | PDFファイル |
題目 | 2A1-02 A Stepwise Training Method for Complex Task Solving Using Reinforcement Learning |
---|---|
著者 | キム マーガレット ((株)ホンダ・リサーチ・インスティチュート・ジャパン) 金 天海 ((株)ホンダ・リサーチ・インスティチュート・ジャパン) 竹内 誉羽 ((株)ホンダ・リサーチ・インスティチュート・ジャパン) 辻野 広司 ((株)ホンダ・リサーチ・インスティチュート・ジャパン) |
論文 | PDFファイル |
題目 | 2A1-03 強化学習のためのParticle Filterを用いた連続行動空間表現 |
---|---|
著者 | 柏村 洋平 (大阪市立大学大学院 工学研究科 電子情報系専攻) 上野 敦志 (大阪市立大学大学院 工学研究科 電子情報系専攻) 辰巳 昭治 (大阪市立大学 大学院工学研究科) |
論文 | PDFファイル |
題目 | 2A1-04 報酬の遅れが大きい状況下での強化学習の学習速度の検討 |
---|---|
著者 | 伊丹 英樹 (京都工芸繊維大学 大学院工芸科学研究科) 板舛 尚樹 (京都工芸繊維大学 大学院工芸科学研究科) 岡 夏樹 (京都工芸繊維大学 大学院工芸科学研究科) |
論文 | PDFファイル |