/ プログラム/ 発表一覧/ 著者一覧企業展示一覧/ jsai2015ホーム /

2L1-4in 限定合理性に触発された強化学習法によるロボット運動学習

*セッションの無断動画配信はご遠慮下さい。

Tweet #jsai2015 このエントリーをはてなブックマークに追加

05月31日(Sun) 09:00〜10:20 L会場(研究棟2F-中講義室 (R791))
2L1 「強化学習(2)」
06月01日(Mon) 09:00〜11:00 L会場(研究棟2F-中講義室 (R791))
3O1 「インタラクティブセッション」

演題番号2L1-4in
題目限定合理性に触発された強化学習法によるロボット運動学習
著者水戸 亜友美(東京電機大学 理工学部)
牛田 有哉(東京電機大学 理工学部)
朝倉 勇護(東京電機大学 理工学部)
甲野 佑(東京電機大学大学院 先端科学技術研究科 情報学専攻)
横須賀 聡(東京電機大学 理工学部)
浦上 大輔(日本大学生産工学部数理情報工学科)
高橋 達二(東京電機大学 理工学部)
時間05月31日(Sun) 10:00〜10:20【一般口頭発表】
06月01日(Mon) 09:00〜11:00【インタラクティブ発表】
概要状態観測の不完全性、計算・記憶資源の有限性から、エージェントが完全な合理性を持つことは一般に不可能であり、より弱い限定合理性を考える必要がある。限定合理性下の意志決定では、最適化ではなく、ある価値基準を超える選択肢でよしとし、別の行動に移る満足化が中心的な方策となる。本研究では満足化の新しいモデリングに基づき、強化学習による粗視化された力学系の制御(ロボットの運動学習)に適用する。
論文PDFファイル