演題番号 | 3A2-04 |
---|---|
題目 | 環境予測学習によるシンボル生成の機構 |
著者 | 赤田 庸平 (東京大学大学院新領域創成科学研究科) 牧野 貴樹 (東京大学 総括プロジェクト機構) 高木 利久 (東京大学大学院新領域創成科学研究科,東京大学統括プロジェクト機構) |
時間 | 6月13日(金) 11:40〜12:00 |
概要 | 環境との相互作用それ自体からのみならず,相互作用のうちに潜む法則性をシンボルとして把持してゆく能力は,高等生物が具備している柔軟な適応力の基盤を構成するものの一つである.本研究では,来るべき環境の予測を学習し,これを行動に活かすことでこの能力を実現する強化学習手法を提案する. |
論文 | PDFファイル |