/ プログラム/ 発表一覧/ 著者一覧企業展示一覧/ jsai2015ホーム /

2L1-3 N本腕バンディット問題における素朴満足化と満足化基準の更新法

*セッションの無断動画配信はご遠慮下さい。

Tweet #jsai2015 このエントリーをはてなブックマークに追加

05月31日(Sun) 09:00〜10:20 L会場(研究棟2F-中講義室 (R791))
2L1 「強化学習(2)」

演題番号2L1-3
題目N本腕バンディット問題における素朴満足化と満足化基準の更新法
著者後藤田 大地(東京電機大学 理工学部)
大用 庫智(関西学院大学 総合政策学部)
高橋 達二(東京電機大学 理工学部)
時間05月31日(Sun) 09:40〜10:00
概要不確実性下の行動選択(バンディット問題)の解法として「不確実な時には楽観的に」という考え方を持つアルゴリズムが代表的であったが、近年、その代替案として「受容可能な基準を満たす選択肢を見つけるまで探索をする」という満足化の有効性が示され初めている。しかし、バンディット問題において高成績を示すためには適切な基準の設定が必要であるため、本研究では基準の動的な自動調節による効率的な満足化の実現を目指す。
論文PDFファイル