/ プログラム/ 発表一覧/ 著者一覧企業展示一覧/ jsai2015ホーム /

1L5 「強化学習とエージェント」

*セッションの無断動画配信はご遠慮下さい。

Tweet #jsai2015 このエントリーをはてなブックマークに追加

05月30日(Sat) 17:20~19:00 L会場(研究棟2F-中講義室 (R791))
座長 横山 裕樹(大阪大学)

発表一覧

時間 17:20~17:40
題目 1L5-1 強化学習を用いた繰り返しゲームにおける戦略の学習の高速化
著者 藤田 渉(大阪大学大学院情報科学研究科情報数理学専攻)
森山 甲一(大阪大学 産業科学研究所)
福井 健一(大阪大学 産業科学研究所)
沼尾 正行(大阪大学 産業科学研究所)
論文 PDFファイル

時間 17:40~18:00
題目 1L5-2 exploration率の共有範囲によるマルチエージェント強化学習の考察
著者 岡野 拓哉(東京工業大学/総合理工学研究科/知能システム科学専攻,(独)産業技術総合研究所/サービス工学研究センター)
野田 五十樹(東京工業大学大学院総合理工学研究科知能システム科学専攻 ,(独)産業技術総合研究所 サービス工学研究センター,JST)
論文 PDFファイル

時間 18:00~18:20
題目 1L5-3 利己的な相互協調:強化学習主体による不確実な囚人のジレンマ
著者 鳥居 拓馬(東京大学大学院 工学系研究科 システム創成学専攻)
日高 昇平(北陸先端科学技術大学院大学知識科学研究科)
論文 PDFファイル

時間 18:20~18:40
題目 1L5-4 マルチエージェント逆強化学習による報酬設計問題の考察
著者 荒井 幸代(千葉大学大学院工学研究科都市環境システムコース)
堀澤 雄介(ソフトバンク(株))
北里 勇樹(千葉大学大学院工学研究科建築・都市科学専攻)
論文 PDFファイル

時間 18:40~19:00
題目 1L5-5 Activity Dependency in Collaborative Networks
著者 ロヨラ パブロ(東京大学)
松尾 豊(University of Tokyo, Department of Technology Management for Innovation)
論文 PDFファイル