/ プログラム / 発表一覧 / 著者一覧 / JSAI2006 ホーム

3F2-4 MDP集団におけるマルチユーザ強化学習エージェント

6月9日(金) 13:00〜14:40 F会場
OS「HAI(ヒューマンエージェントインタラクション)」1

演題番号3F2-4
題目MDP集団におけるマルチユーザ強化学習エージェント
著者片上 大輔 (東京工業大学大学院総合理工学研究科)
新田 克己 (東京工業大学大学院総合理工学研究科)
時間6月9日(金) 14:00〜14:20
概要本研究では、ユーザ集団とのインタラクションから学習を行なうマルチユーザ強化学習エージェント(MULA-Q)を提案し、マルコフ決定過程(MDP)の上のマルチタスク強化学習問題において提案手法の有効性を定量的に評価する。
論文PDFファイル

/ プログラム / 発表一覧 / 著者一覧 / JSAI2006 ホーム