/ プログラム/ 発表一覧/ 著者一覧企業展示一覧/ jsai2014ホーム /

2H1 「強化学習の基礎」

*セッションの無断動画配信はご遠慮下さい。

Tweet #jsai2014 このエントリーをはてなブックマークに追加

05月13日(Tue) 09:00~10:20 H会場(102人-ひめぎんホール 第8会議室)
座長 野田 五十樹(産業技術総合研究所)

発表一覧

時間 09:00~09:20
題目 2H1-1 部分観測環境のパラメトリック記述に基づく高速モデルパラメータ逆強化学習プログラム
著者 牧野 貴樹(東京大学 生産技術研究所)
城 真範(産総研 HTRI 情報数理)
合原 一幸(東京大学生産技術研究所)
論文 PDFファイル

時間 09:20~09:40
題目 2H1-2 e射影に基づく方策探索法
著者 植野 剛(科学技術振興機構 湊離散構造処理系プロジェクト)
論文 PDFファイル

時間 09:40~10:00
題目 2H1-3in メタヒューリティクスによる強化学習のパラメータの最適化
著者 安政 駿(筑波大学院 図書館情報メディア研究科 図書館情報メディア専攻)
手塚 太郎(筑波大学 図書館情報メディア系)
論文 PDFファイル

時間 10:00~10:20
題目 2H1-4 多腕バンディットにおけるリグレットの非線形拡張
著者 梁 曽漢(東京大学大学院情報理工学系研究科数理情報学専攻)
小宮山 純平(東京大学大学院情報理工学系研究科数理情報学専攻)
大岩 秀和(東京大学情報理工学系研究科数理情報学専攻)
佐藤 一誠(東京大学 情報基盤センター)
中川 裕志(東京大学情報基盤センター)
論文 PDFファイル