/ プログラム / 発表一覧 / 著者一覧 / jsai2008 ホーム

2A1-04 報酬の遅れが大きい状況下での強化学習の学習速度の検討

6月12日(木) 09:00〜10:20 A会場
強化学習1

演題番号2A1-04
題目報酬の遅れが大きい状況下での強化学習の学習速度の検討
著者伊丹 英樹 (京都工芸繊維大学 大学院工芸科学研究科)
板舛 尚樹 (京都工芸繊維大学 大学院工芸科学研究科)
岡 夏樹 (京都工芸繊維大学 大学院工芸科学研究科)
時間6月12日(木) 10:00〜10:20
概要報酬の遅れが大きい状況下での強化学習は、学習速度が遅いという欠点を持つと言われている。本論文では、報酬が得られるまでの時間の違いに注目して行動価値を決める方法により、高速な学習が可能であることを実験的に示す。
論文PDFファイル

/ プログラム / 発表一覧 / 著者一覧 / jsai2008 ホーム