演題番号 | 2I3-02 |
---|---|
題目 | 分散秘密情報源からの強化学習 |
著者 | 佐久間 淳 (東京工業大学) 小林 重信 (東京工業大学) Rebecca Wright ("Rutgers, The state university of New Jersey") |
時間 | 6月12日(木) 16:40〜17:00 |
概要 | "近年、ネットワーク環境の発展に伴い、物理的エージェントやソフトウェアエージェントによって収集される多様な情報を横断的に収集することが可能になりつつある。分散強化学習は、このような分散化された情報源に基づき、複数のエージェントが長期的な利得を最大化するための確率的な制御側を、環境に対する知識なしで獲得することを目指す枠組みである。従来の分散強化学習は、通信帯域の制約など、物理的な制約のために、分散化された観測の完全な統合が困難であることを想定しており、その制約下における準最適な制御側の効率的な学習が追求されてきた。一方、本研究では、機密保護やプライバシー保護などの社会的制約のために、分散化された情報源からの観測の統合が困難である状況を想定する。このような制約に対処するために、本研究では公開鍵暗号やSecure Multi-party Computationと強化学習を組み合わせる. 提案アルゴリズムでは, 複数エージェント間の観測を一切共有することなく、最適な制御則のみを学習することが可能である。" |
論文 | PDFファイル |