05月26日(Fri) 14:10〜15:50 C会場(ウインクあいち-9F 902会議室)
| 演題番号 | 4C2-1 |
|---|---|
| 題目 | 協調行動の獲得に向けた逆強化学習の導入 |
| 著者 | 本木 雄斗(千葉大学大学院融合理工学府 地球環境科学専攻 都市環境システムコース) 荒井 幸代(千葉大学 大学院工学研究科都市環境システムコース) |
| 時間 | 05月26日(Fri) 14:10〜14:30 |
| 概要 | マルチエージェント系のうち,各々のタスク達成の過程で行動の競合が生じる問題を対象とする.譲歩含む協調行動を強化学習によって獲得させるには,他者の行動や状態の共有が必要となるが状態空間が膨大となる.そこで本論文では,協調行動を報酬関数の設計によって獲得させることを考える.具体的には,Abbeelの逆強化学習をマルチエージェント系に導入する際に生じる問題を指摘し,これらの問題を回避する方法を提案する. |
| 論文 | PDFファイル |