演題番号 | 3C4-4 |
---|---|
題目 | 線形時系列予測と強化学習を用いた動的な学習適応システム |
著者 | 今井 智也(公立はこだて未来大学) 三上 貞芳(公立はこだて未来大学) |
時間 | 06月19日(Fri) 15:40〜16:00 |
概要 | 本研究では多様に変化する環境においてマルチエージェントが行動選択の競合により生じる学習効率の低下を回避するシステムを提案する.具体的にはエージェントが他のエージェントの行動を単純な線形時系列予測を用いて大まかに予測し,予測された結果から強化学習を用いて行動選択を行うことで,エージェント全体を協調状態へと収束させる.検証のため,連続場での椅子取りゲーム問題を提案し,計算機実験で有効性を確認した. |
論文 | PDFファイル |