演題番号 | 2A1-04 |
---|---|
題目 | 報酬の遅れが大きい状況下での強化学習の学習速度の検討 |
著者 | 伊丹 英樹 (京都工芸繊維大学 大学院工芸科学研究科) 板舛 尚樹 (京都工芸繊維大学 大学院工芸科学研究科) 岡 夏樹 (京都工芸繊維大学 大学院工芸科学研究科) |
時間 | 6月12日(木) 10:00〜10:20 |
概要 | 報酬の遅れが大きい状況下での強化学習は、学習速度が遅いという欠点を持つと言われている。本論文では、報酬が得られるまでの時間の違いに注目して行動価値を決める方法により、高速な学習が可能であることを実験的に示す。 |
論文 | PDFファイル |