/ プログラム/ 発表一覧/ 著者一覧企業展示一覧/ jsai2015ホーム /

1L5-2 exploration率の共有範囲によるマルチエージェント強化学習の考察

*セッションの無断動画配信はご遠慮下さい。

Tweet #jsai2015 このエントリーをはてなブックマークに追加

05月30日(Sat) 17:20〜19:00 L会場(研究棟2F-中講義室 (R791))
1L5 「強化学習とエージェント」

演題番号1L5-2
題目exploration率の共有範囲によるマルチエージェント強化学習の考察
著者岡野 拓哉(東京工業大学/総合理工学研究科/知能システム科学専攻,(独)産業技術総合研究所/サービス工学研究センター)
野田 五十樹(東京工業大学大学院総合理工学研究科知能システム科学専攻 ,(独)産業技術総合研究所 サービス工学研究センター,JST)
時間05月30日(Sat) 17:40〜18:00
概要マルチエージェント強化学習(以下 MARL)の情報共有の研究は数多く行われている。
多くの研究では経験や報酬テーブルを共有している。しかし、人間社会では行動に対しての考え方(慎重や大胆など)と言えるexploration率の共有についてはあまり研究されていない。
そこで、本研究では、exploration率を共有することによるMARLの系の変化を考察する。
論文PDFファイル