/ プログラム/ 発表一覧/ 著者一覧企業展示一覧/ jsai2016ホーム /

1M2 機械学習「強化学習」

*セッションの無断動画配信はご遠慮下さい。

Tweet #jsai30th このエントリーをはてなブックマークに追加

06月06日(Mon) 10:20~12:00 M会場(81名-AIM3F 315会議室)
座長 小宮山 純平(東京大学生産技術研究所)

発表一覧

時間 10:20~10:40
題目 1M2-1 線条体の動作に触発された習慣形成の強化学習モデル
著者 甲野 佑(東京電機大学大学院 先端科学技術研究科 情報学専攻)
水戸 亜友美(東京電機大学 理工学部)
太田 宏之(防衛医科大学校生理学講座)
高橋 達二(東京電機大学 理工学部)
笹川 隆史(東京電気大学 理工学部)
論文 PDFファイル

時間 10:40~11:00
題目 1M2-2 報酬関数と状態表現の相互改善による徒弟学習の効率化
著者 吉永 和史(千葉大学大学院工学研究科都市環境システムコース)
荒井 幸代(千葉大学大学院工学研究科都市環境システムコース)
論文 PDFファイル

時間 11:00~11:20
題目 1M2-3 探索割合を自律調節する強化学習手法-満足化基準の動的獲得-
著者 牛田 有哉(東京電機大学 理工学部)
甲野 佑(東京電機大学大学院 先端科学技術研究科 情報学専攻)
浦上 大輔(日本大学生産工学部数理情報工学科)
高橋 達二(東京電機大学 理工学部)
論文 PDFファイル

時間 11:20~11:40
題目 1M2-4 成功確率と収益を組み合わせた行動価値に基づく強化学習
著者 堀江 直人(名古屋工業大学工学部情報工学科)
松井 藤五郎(中部大学工学部情報工学科,中部大学生命健康科学部臨床工学科)
森山 甲一(名古屋工業大学 大学院工学研究科)
武藤 敦子(名古屋工業大学)
犬塚 信博(名古屋工業大学 工学研究科情報工学専攻)
論文 PDFファイル

時間 11:40~12:00
題目 1M2-5 逐次的な自然方策勾配推定法の解析と勾配推定分散の最小化による効率的な強化学習法の提案
著者 岩城 諒(大阪大学大学院工学研究科知能機能創成工学専攻)
横山 裕樹(玉川大学工学部機械情報システム学科)
浅田 稔(大阪大学大学院工学研究科知能機能創成工学専攻)
論文 PDFファイル