/ プログラム/ 発表一覧/ 著者一覧企業展示一覧/ jsai2014ホーム /

4H1-3 学習あり繰り返し囚人のジレンマにおける協調行動の発生

*セッションの無断動画配信はご遠慮下さい。

Tweet #jsai2014 このエントリーをはてなブックマークに追加

05月15日(Thu) 09:00〜10:40 H会場(102人-ひめぎんホール 第8会議室)
4H1 「強化学習とエージェント」

演題番号4H1-3
題目学習あり繰り返し囚人のジレンマにおける協調行動の発生
著者鳥居 拓馬(北陸先端科学技術大学院大学 知識科学研究科)
日高 昇平(北陸先端科学技術大学院大学知識科学研究科)
真隅 暁(北陸先端科学技術大学院大学知識科学研究科)
時間05月15日(Thu) 09:40〜10:00
概要従来、社会的ジレンマのモデルとしてゲーム理論を用い、協調行動の発生が議論されてきた。本研究では、各プレイヤーが報酬により行動を変える強化学習の枠組みを仮定し、代表的なゲームの一つである繰り返し囚人のジレンマを検討した。すべてのプレイヤーの行動履歴を状態遷移行列で表現し、そのダイナミクスを分析した。その結果、より長い行動履歴に基づき学習するほど、協調行動が安定して発生することが明らかになった。
論文PDFファイル