3C4-4 線形時系列予測と強化学習を用いた動的な学習適応システム

06月19日(Fri) 14:40〜16:00 C会場(ホール棟5F-53室)
3C4 機械学習・データマイニング「知識獲得2」

演題番号	3C4-4
題目	線形時系列予測と強化学習を用いた動的な学習適応システム
著者	今井智也(公立はこだて未来大学) 三上貞芳(公立はこだて未来大学)
時間	06月19日(Fri) 15:40〜16:00
概要	本研究では多様に変化する環境においてマルチエージェントが行動選択の競合により生じる学習効率の低下を回避するシステムを提案する．具体的にはエージェントが他のエージェントの行動を単純な線形時系列予測を用いて大まかに予測し，予測された結果から強化学習を用いて行動選択を行うことで，エージェント全体を協調状態へと収束させる．検証のため，連続場での椅子取りゲーム問題を提案し，計算機実験で有効性を確認した．
論文	PDFファイル