4H1-3 学習あり繰り返し囚人のジレンマにおける協調行動の発生

*セッションの無断動画配信はご遠慮下さい。

05月15日(Thu) 09:00〜10:40 H会場(102人-ひめぎんホール第8会議室)
4H1 「強化学習とエージェント」

演題番号	4H1-3
題目	学習あり繰り返し囚人のジレンマにおける協調行動の発生
著者	鳥居拓馬(北陸先端科学技術大学院大学知識科学研究科) 日高昇平(北陸先端科学技術大学院大学知識科学研究科) 真隅暁(北陸先端科学技術大学院大学知識科学研究科)
時間	05月15日(Thu) 09:40〜10:00
概要	従来、社会的ジレンマのモデルとしてゲーム理論を用い、協調行動の発生が議論されてきた。本研究では、各プレイヤーが報酬により行動を変える強化学習の枠組みを仮定し、代表的なゲームの一つである繰り返し囚人のジレンマを検討した。すべてのプレイヤーの行動履歴を状態遷移行列で表現し、そのダイナミクスを分析した。その結果、より長い行動履歴に基づき学習するほど、協調行動が安定して発生することが明らかになった。
論文	PDFファイル