私のブックマーク
ディジタルゲームの人工知能の歴史的変遷─ルールベースからディープラーニングまで
三宅 陽一郎((株)スクウェア・エニックス)
1.は じ め に
本誌で
を書かせていただいたのが2017年である.そこから,ディジタルゲームの人工知能はかなり状況が変化した.一つの要因はゲーム産業内の変化であり,もう一つは他の人工知能分野がそうであるように,ディープラーニングの隆盛によるアルゴリズムの変化である.特に強化学習と組み合わせた深層強化学習の発展がある.しかし,ディープラーニングの産業的応用は実用レベルの直前といったところである.前回はトピックごとに分類したので,今回はディジタルゲーム AIの発展の歴史を把握できるように時系列に沿ってキーとなるブックマークを展開していく.
2.現状と展望
先に 2022年のゲーム産業における人工知能の技術,および開発コミュニティの現状について述べる.ゲーム産業の人工知能技術の現状を総括すると,「従来の記号主義型人工知能の利用を促進しつつも,水面下でディープラーニングの技術を蓄積して,ゲームへの応用を狙っている」という状況にある.水面下で激しい変化が起きているが,表面にはその一部が現れているのみである.ここでいう記号主義型とは,ステートマシン,ビヘイビアツリー,そしてプランニング技術などを指す.ディープラーニングはさまざまな方向の応用が目指されているが,ディープラーニングを用いた画像認識,画像変換,そして深層強化学習である.
2・1 黎明期の歴史
現在につながるディジタルゲームの人工知能の本格的な導入は, 1990年代半ばのゲームの3D化に伴うキャラクタ制御の課題を乗り越えようとしたところに始まる.主にアメリカにおいて促進された産業,学術をまたいだ連携が推進され,ロボティクスの人工知能技術を主として,大学から産業へ技術が移転された.その動きはヨーロッパにも飛び火し,ヨーロッパの各大学でディジタルゲームの人工知能の研究が開始された.この 2000年前後において,日本はゲーム産業としてもアカデミックとしても,全く蚊帳の外であった.日本のゲーム産業はこの時点までは世界を席巻しており,他国の情報を積極的に追う必要を感じなかったし,アメリカの深いコミュニティの中の変化をたどる手段もなかった.また,ゲーム産業は他の産業と違い高度成長期をアカデミズムと歩んだ産業ではないので,そもそも大学との関係が希薄だった.それは現在でも同様であり,日本でディジタルゲームの人工知能技術をメインテーマにしている研究室は数か所程度である.
2・2 ディジタルゲームAIコミュニティの形成
2000年以降,産業カンファレンスでは GDC(Game Developers Conference),学術カンファレンスではAAAI,その分科会である AIIDE(AI and Digital Entertainment),IEEE CoG(Conference on Games,2018年まではComputational Intelligence and Games:CIG)などで,ディジタルゲームの人工知能技術の発表が蓄積されていった.さらにGDCでは, 2009年以降,AI専門の分科カンファレンス「AI Summit」が開始され,その運営母体も兼ねて「AI Game Programmers Guild」が設立された.これはフランクなコミュニティであり,多少のディジタルゲームの人工知能の研究・開発研究があれば誰でも入会できた.活発なメイリングリストを通して世界的にやり取りされ,ゲームAI開発者を束ねる役割を果たした.書籍としては『AI Game Programming Wisdom』や『AI Game Pro』を編集し出版した.しかし, 2016年以降は失速した.これは,分野自体を推進する新しいトピックに欠けていたため,またゲームデザインがオープンワールド化し,既存のゲームAI技術をオープンワールドに拡張することが主業務になってしまったためだと考えられる.つまりディジタルゲームAIの技術の隆盛は, 2000~10年におけるFPS(一人称視点シューティングゲーム,ファーストパーソンシュータ)における需要と, 2011~ 15年のその技術の中型・小型のゲームへのスピンオフに支えられたブームであり,その技術が講演や論文,書籍記事の形で共有された.現在,その主要な成果はゲームエンジンに内包され,誰でも使える形となっている.2016年以降はさらに大型化するオープンワールド型のゲームに既存の人工知能技術を拡張することとなり,現在でもこの動向が続いている.ゲームAI自体は発展し多様化・活性化を続けているため,新しいリーダシップが求められている.
2・3 機械学習の隆盛
さらにもう一つの流れがディジタルゲームに対する機械学習の応用の流れである.機械学習は広い領域を指す言葉なので,あえてディープラーニング技術と言い換える.もちろん機械学習アルゴリズムも,進化的アルゴリズムの応用もあるが,それよりはるかに大きく強くディープラーニング技術の応用がディジタルゲームに対して推進されているからである.この流れは 2013年以降のディープラーニング技術の世界的な学術・産業隆盛と同期している.しかし結論からいえば,ディープラーニング技術がディジタルゲームに実装されている例は年に数例を数えるのみである( 2022年現在).ゲーム開発技術まで広げれば数十例まで増えるだろう.この 5年ほどで数例レベルとはいえ着実にディジタルゲームへの実装は増えているので,機械学習のディジタルゲームへの導入はブレークスルーを待っている状況である.数年後にはディジタルゲームにおけるディープラーニングの実装は当たり前になっているかもしれない.しかし,どの年にそのブレークスルーが起こるかはわからない.ゲーム産業で人工知能開発・研究を行っている研究者・開発者は,自分がそのブレークスルーの先端を担おうと研究・開発を進めている.筆者も例外ではない.
このゲーム産業においてディジタルゲームにおけるディープラーニング技術を推進する一群はまだ明確にコミュニティ化されていないが,「AI Programmers Guild」のコミュニティとは別途のものである.例えば GDCでは,「 AI Summit」とは独立に「 ML Summit」( Machine Learning Summit)が開催されている.しかし,活況とは言いがたい.つまり,現在ゲーム産業には,弱体化しつつあるが,従来の記号主義型人工知能を主体とする流れと,成長しつつある機械学習を推し進めようとする二つの流れが存在するのである.日本だけを見れば,もともと記号主義型人工知能の導入さえ遅れていたところに,ディープラーニングの流れが来た.そこで,もともと世の中の趨勢に流されやすい各ゲーム企業は,ディープラーニング技術の研究・開発に取り組んでいる.ところが,以前のゲーム AI技術の吸収が済んでいないところにディープラーニングの研究・開発を進めたために,エンドトゥエンドのディープラーニングで解決しようとする傾向がある.現実的な着地点は,記号主義型人工知能と機械学習技術を組み合わせるところにある.
2・4 ディープラーニングの適用の課題
では,何がディープラーニングのディジタルゲームの実装を困難にしているのであろうか.
ディジタルゲームの目的は,ユーザにゲームごとのユニークな体験をつくることにある.アプリケーションであれば利便性であるとか,情報処理であれば簡易性などが問題になるが,ディジタルゲームは綿密な設計によってユーザの体験を形づくる.ところが,ディープラーニングの原理は非常に強力であるが,適用条件が狭く限定的であり,多くの場合,ゲームデザインと衝突を起こしてしまう.例えば,「モンスターの知能をユーザとの戦闘で成長させる」というアイディアがあったとする.これをディープラーニングと強化学習で実装することは可能である.しかし,モンスターがどのように強くなっていくかがゲームデザインのポイントであるから,勝手な学習曲線をたどってもらっては困る.ディープラーニングのパラメータを調整してユーザが楽しめる,つまり徐々に強くなっていく学習曲線にする必要がある.ディープラーニング技術をディジタルゲームに実装すること自体は難しくない.要点は,それをゲーム開発者からカスタマイズ可能にすることである.ゲーム AI技術は常にゲームデザインとのすり合わせが必要であり,調整できない技術は導入することができない.ディープラーニング技術をゲームデザインに沿って調整する手法の研究が必要であるが,そのような研究はほとんどない.ディープラーニングの可能性を検証したら,このような研究をゲーム産業で行う必要がある.
一般にディジタルゲーム AIの技術に必要な要素が三つある.
多様性…その技術によって,さまざまな知能をつくれること
拡張性…賢くないキャラクタ(ザコキャラ)からボスキャラクタまで同じ仕組みでつくれること
カスタマイズ性…開発者が思いどおりにその知能を変更できること
ディープラーニング技術はこの 3番目のカスタマイズ性が著しく低い.そのために導入が進まないのである.一方,皮肉なことに,ディープラーニング技術の研究は,ゲーム産業外で活発である.それらは,主にリアルタイムでインタラクティブなエージェントを作成するのに用いられる.ゲームやシミュレータはあくまでトレーニングの手段であり,それ自体を出荷するわけではない.この状況がディジタルゲームの利用を加速しており, 2018年をピークとして既存のゲームを利用する実験が多数がなされた(表1).
表1 ゲーム産業以外でのディープラーニングのゲームへの実装例
2・5 総 括
ゲーム産業における人工知能技術分野は夜明け前といった感がある.これまでの記号主義型人工知能はその大きな蓄積のうえに拡張がなされており,新興のディープラーニング技術の本格的導入が,そこかしこで実験・準備されている.大学,他産業との連携も以前より盛んである.大学では人工知能分野の基盤が整備され,ゲーム産業はそれを活用することを望んでいる.新しい人材,学士,修士,博士でディープラーニング技術の研究した人材がゲーム産業に年々入ってきており,また各企業は積極的にそのような人材を求めている.彼らが責任者となって最前線に立つのはほんの 2~ 3年後のことである.ディジタルゲームの人工知能技術は新しい局面を形成しつつある.それは新しいゲームデザインをもたらし,ディジタルゲームに新しい息吹を形成するはずである.
以下,時間軸に沿って,歴史的な資料のみを列挙する.網羅的なリストについては,私のブックマーク「ディジタルゲームの人工知能(Artificial Intelligence in DigitalGame)」[1]を参照されたい.
2・6 基 本 知 識
ディジタルゲームの人工知能は,主に三つの人工知能に動的協調連携モデルである.
メタAI(Meta-AI):ゲーム全体を動かす俯瞰的な人工知能
キャラクタAI(CharacterAI):キャラクタの頭脳
スパーシャルAI(SpatialAI):担当する空間固有の情報を保持し,キャラクタに対する地形特有の動作をサポートする.パス検索などナビゲーションAI(Navigation AI)の発展形である.
メタAI,キャラクタAI,スパーシャルAIの三者を動的連携する仕組みを,「MCS-AI動的連携モデル」(Meta-Character-Spatial AI Dynamic Cooperative Model)と呼ぶ.
3.ブックマークリスト
【1980年代資料】
§1 ディジタルゲーム AIの起源
パックマンの全仕様書は,人工知能学会誌に掲載された.
また,パックマンの作者である岩谷徹氏のインタビューも上記に収録されている.
パックマンがなぜゲーム AIの原点なのか,という点はわかりにくいかもしれない.以下のインタビューなどが参考になる.
また,古典的なゲームから人工知能技術を抽出するためには,一定の知識が前提となる.この手法についての三宅の論文は以下である.
『パックマン』には,ディジタルゲームの人工知能の三つの要素「メタAI」,「キャラクタAI」,「スパーシャルAI」の萌芽が含まれている.
また本論文のもととなった日本のディジタルゲームの歴史に関する国際会議の2021年の基調講演がある.
- Replaying Japan| Keynote presentation: Youichiro Miyake
“The History of Game AI in Japan”[6]
Replaying Japan [7]
§2 80年代のディジタルゲームAI技術
80年代にAIで抜きん出たゲームはパックマンだけではなかった.麻雀ゲーム『ぎゅわんぶらあ自己中心派』は,評価値システム,つまりユーティリティベースの人工知能を大規模に応用したものであった.
80年代のディジタルゲームはまさにゲームユーザを猛烈な勢いで獲得していった時代である.ゲーム文化自体が立ち上がった時代であった.しかし,そこで問題となったのが,ユーザのゲームスキルの多様な分布であった.アーケードゲームで腕をならしたユーザもいれば,ファミリーコンピュータで初めてゲーム機を触る,というユーザも存在した.そこで,簡単,普通,難しい,というモードを付ける,という方法が多く採用されたが,もう一つの方向として,動的難易度調整(Dynamic Difficulty Adjustment:DDA)が考案された.これは,ゲームプレイからユーザのスキルを判定しゲーム内でゲームの難易度を変化させていく方法である.最も良く知られた例は,遠藤雅伸氏による『ゼビウス』(ナムコ,1983)である.
- 三宅陽一郎,水野勇太,里井大輝:「メタAI」と「AIDirector」の歴史的発展,デジタルゲーム学研究,13巻,2号,pp.1-12(2020)[9]
- 長谷洋平:バンダイナムコスタジオにおけるゲーム AIの歴史とこれから,東京工科大学講義資料(2018)[10]
【1990年代資料】
§3 AIゲーム
80年代がディジタルゲームの発展期であるとすれば,90年代はそれをさらに拡張した激動の時代であった.2Dから3Dへの変化,携帯ゲーム機の普及などがあった.その裏で,第二次人工知能ブームが終焉を迎えたのも 90年代初頭であった.ところが,第二次人工知能ブームの余波は数年遅れでゲーム産業に影響を及ぼす.そこで90年代には,「AIゲーム」が誕生する.これは人工知能技術を主体とするゲームである. 90年代はスーパーファミコン,64,プレイステーション,ドリームキャストなどの時代である.ハードウェアの性能からいっても何もかもを完備したゲームを出せるほどのマシンパワーではない.人工知能技術を実装するだけでゲームリソースのほとんどを使ってしまう.しかし,人工知能技術によってとがったゲームを出そうとするゲームは,「AIゲーム」として世に出されることになった.
この「AIゲーム」は 80年代からあったものである.技術デモとしては『ELIZA』(1966)があるが,この『ELIZA』はディジタルゲームのナラティブ(語り)を示した最初の例であり,テキスト型アドベンチャー, RPGの源流となった.
商業作品としては『エミー2』(ASCII,1984),『リトル・コンピュータ・ピープル』(Activision,1985)などがある.このあたりの事情は,森川幸人氏の本学会誌の解説記事の付録に詳しい.森川幸人氏は90年代中盤から現在まで「AIゲーム」を牽引する人物であり,ニューラルネットワークを用いた『がんばれ森川君 2号』(SCE,1997),遺伝的アルゴリズムを用いた『アストロノーカ』(エニックス,muumuu,1998)『くまうた』(SIE,muumuu,2003)などの多数のAIゲームの代表作がある.これについても以下の解説記事に記述されている.
- 森川幸人:テレビゲームへの人工知能技術の利用,「AI技術の産業応用」第7回,人工知能,Vol.14, No.2,pp.214-218(1999)[12]
- マリオに「自力でクリアしてよ」と思っていた── AIそのものをゲームにした世界最高峰のゲームAI誕生秘話──『がんばれ森川君 2号』『アストロノーカ』,『くまうた』制作者・森川幸人氏インタビュー,聞き手:三宅陽一郎,電ファミニコゲーマ,ー編集部,カメラ:佐々木秀二,電ファミニコゲーマー(2019)[13]
- ゲーム系AI開発の第一人者・森川幸人氏が見据える未来とは! ゲーム AIの今後の方向性を訊く【BitSummitVolume6】,ばしを編集部,ファミ通.COM(2018)[14]
また海外では, PCゲームとして『Creatures』(Millennium Interactive,1996)が学習する人工生命を実装し,論文の形で開発の仕様を残している.8000ノードからなるニューラルネットワークで当時のゲームとしては大規模なものであった.そして90年代としては,ニューラルネットワークを使用したまれな例であった.
- Grand, S., Cliff, D. and Malhotra, A.: Creatures: Artificial life autonomous software agents for home entertainment, Proc. First Int. Conf. on Autonomous Agents(1997)[15]
- Grand, S. and Cliff, D.: Creatures: Entertainment software agents with artificial life, Autonomous Agents and Multi-Agent Systems, Vol.1, No.1, pp.39-57(1998)[16]
§4 会話ゲーム
『シーマン』(セガ,ビバリウム,1999)はシーマンという人工生命が自然言語(日本語,英語)で音声会話をするゲームである.独立不遜なキャラクタとして設定されているシーマンは,ユーザが驚くような回答をする.本学会の中でも,なぜ 20年以上も前に AIとの自然な自然言語会話ができたのか,という声があがり,作者の斎藤由多加氏に学会誌としてインタビューを行った.
技術的にはルールベースとユーティリティベースであるが,そこに斎藤氏の「メロディ言語」という独自のアイディアが重ねられている.これは,同じ単語でも音の抑揚によって意味を出すという日本語の特徴を取り入れたものである.
§5 キャラクタ学習ゲーム
『ワンダープロジェクトJ』(エニックス,1994),『ワンダープロジェクトJ2』(エニックス,1996)はユーザがゲーム内のキャラクタと選択肢や指図などで指示を出すことで,キャラクタがその経験からゲーム世界における正しい行動を学習していく.基本的にゲームの各状態に対するユーティリティベースの評価を学習していく方式である.近年,スクウェア・エニックス社のゲーム開発資料保存プロジェクト「SAVE」によって資料が発掘され,CEDECなどのゲームカンファレンスで仕様が公開された.
- スクウェア・エニックスの開発資料を管理する新プロジェクト “SAVE”.『ワンダープロジェクトJ』の開発資料も見つかり,製作者より誕生秘話がたっぷりと語られた【CEDEC2021】,西川くん,ファミ通 .COM(2021)[18]
- 三宅陽一郎,藤本広貴:資料を資産へ,スクウェア・エニックスにおけるゲーム開発資料発掘プロジェクト[Wonder Project J編],CEDEC 2021 [19](無料で登録のうえ,ダウンロード可能)
【2000年代資料(2000〜09)】
§6 欧米のゲームの再隆盛とそれを支えたゲームAI技術
これまで見てきたように 80年代, 90年代のディジタルゲームでAIといえば,特定のゲームで実装されたAI技術で,それによって,ゲームが特徴付けられてしまう「AIゲーム」のことであった.しかし,2000年代からはディジタルゲームの基礎としてAI技術が本格的に組み込まれていくことになる.
キャラクタAIの分野を切り開いたのは,マサチューセッツ工科大学(MIT)からアメリカのゲーム産業への人工知能技術の流入である.そこで大きな役割を果たしたのが大型FPSゲームにおける人工知能の導入である.エポックな仕事としては二つある.『Halo2』(Bungie,2004)を通じてエージェントアーキテクチャ,アフォーダンスなどの,キャラクタAIの基礎をゲーム産業にもたらしたDamian Isla氏の仕事と,「ゴール指向型アクションプランニング」(GOAP:Goal-Oriented Action Planning)を導入した Jef Orkin氏の仕事である.
上記はMIT Media Labの「Synthetic Character Group」のバーチャルエージェントに関する研究成果であり,この成果は広くゲーム産業で共有され,ここに現代のディジタルゲームAIの礎が置かれたといってよい.この研究グループの一員であったIsla氏は,この後,Bungieに入社し『Halo2』のAI全般の設計を行うことになる.『Halo2』のAIで特に重要であったのが,意思決定アルゴリズムとして発案された「ビヘイビアツリー」(Behavior Tree)である.それまで主流であったステートマシンによる意思決定の欠点を補う拡張性をもつアルゴリズムであり,実に2011年以降,ゲーム産業における意思決定アルゴリズムとして7割のシェアをもつ最も人気の高いものである.
- Damian Isla GDC: Managing Complexity in the Halo 2AI System, Game Developers Conference 2005 [21]
(Webにおける解説記事)[22]
(講演動画)[23]
「ビヘイビアツリー」はゲーム産業を超えて,ロボティクスのAIなど,リアルタイム系AIの意思決定システムのデファクトスタンダードとして活躍している.現在の二大ゲームエンジン「Unity3D」,「Unreal Engine 4/5」でも使用することができる.特に,「Unreal Engine 4/5」では,ビヘイビアツリーのエディタが準備され,これを中心にさまざまなAI機能をリンクさせる形になっている.
「ビヘイビアツリー」は最初から人気があったわけではなく,数年をかけてゲーム産業を超えて世界的に人気を博するようになった.しかし,2015年以降の,ゲームのオープンワールド化に伴う飛躍的なサイズの拡大は,ビヘイビアツリーの肥大化をもたらし,拡張性が高いとはいえ,あまりに巨大化したビヘイビアツリーは人間が意思決定を記述する方法の限界を示している.
そこで,現在注目されているのが「HTN」(Hierarchical Task Network)やGOAPなどのプランニング技術である.ゲーム産業における意思決定技術は,スクリプティッドAI(スクリプト言語などで意思決定のルールやユーティリティを定義すること)から,ステートマシン,ビヘイビアツリーを経てきたが,それらはすべて反射的なアルゴリズムである.一方プランニング技術は,非反射的な未来に対して予測・計画をする意思決定システムであり,また自動的にプランを作成するために開発者の作業が肥大化することも少ない.
GOAPはMIT Media Lab出身のJef Orkin氏が『F.E.A.R.』(Monolith Productions, 2005)で導入した手法である.プランニングといえば,通常は工場や,組立ての計画を数秒~数時間かけて作成し実行するイメージであるが,リアルタイム意思決定で用いるGOAPの場合は 1/60秒や,その数倍の時間の中でプランニングを行う.
Jeff Orkin博士のMITにおけるサイト.GOAPの情報が集約されている.HTNは『Killzone 2』(Guerrilla Games,2009)においてゲーム産業で初めて導入された.続編である『Killzone 3』(Guerrilla Games,2009)でも使用されている.
- Remco Straatman, Alex Champandard: Killzone 2 Multiplayer Bots, Game AI Conference,Paris(June2009)[26]
- Remco Straatman, Tim Verweij, Alex Champandard, Robert Morcus, and Hylke Kleve: Hierarchical AI for Multiplayer Bots in Killzone 3, GAME AI PRO(2013)[27]
§7 メタ AIの台頭
メタAIはゲーム全体をコントロールするAIであり,ディジタルゲーム特有のAIであるが,逆に,それゆえに,他分野における応用の可能性が広がっている.特にスマートシティにおける都市を管理するAIとして,活躍が期待されている.ロボカップサッカーなど,マルチエージェントを指揮するAIをチームAIやファシリテータAIと呼ぶが,メタAIはこれとも違うものである.メタAIが管理するのはゲーム全体であり,敵・味方キャラクタ,天候,すべてのオブジェクトをコントロールすることができる.以下の文献に,メタAIの発展の歴史がまとめられている.
§8 ナビゲーションAIについて
ナビゲーションAIの初期の仕事は,当時1000万本を超える世界的ヒットとなった「カウンタストライク」(Valve Software,2000)に実装されたナビゲーションAIである.
- Booth, M.: The Making of the Official Counter-Strike Bot, GDC 2004 [28]
より詳細なナビゲーションAIの資料については,前回(Vol.37, No.5)のブックマーク [29]の「(6)ナビゲーションAI」を参照.
ナビゲーションAIは,2010年代により発展したゲーム空間全体を解析する「スパーシャルAI」(Spatial AI)として発展していく.
§9 学習アルゴリズムの台頭
ディジタルゲームにおける学習型AIは,主に強化学習を使用される場合が多い.ディジタルゲームはシミュレーションであり,繰り返し試行錯誤がしやすいためである.学習型AIが盛況となるのは,2016年以降であるが,その出発点となる萌芽的研究は,2002年の『Black & White』(Lionhead Studios,2001)における導入と,2004年のMicrosoft Researchによる格闘ゲームにおけるテーブル型強化学習アルゴリズムの研究成果である.また2005年にはレーシングゲームにおける強化学習が実装されている.
- Evans, R.: Varieties of learning, AI Programming Wisdom, chapter 11.2, pp. 567-578, Charles River Media(2002)[30]
『Black&White』にはパーセプトロンや ID3アルゴリズムを用いた学習が実装されている. - Graepel, T., Herbrich, R. and Gold, J.: Learning to fight, Proc. Int. Conf. on Computer Games: Artificial Intelligence, Design and Education(2004)[31]
Microsoft Researchのグループによる格闘ゲームにおける強化学習の研究である.最も早い強化学習のゲームへの応用事例である. - Microsoft Research: Video Games and Artificial Intelligence(2009)[32]
- Thompson, T.: How Forza’s Drivatar Actually Works, Game Developer(2005)[33]
『Forza Motorsports』(Microsoft Game Studio,2005~)はプレーヤのログから学習によってレーシングAIを生み出す「Drivatar」を 2005年以来ずっと開発し,実装している.
【10年代,20年代資料(2010〜22)】
§10 2010年代の記号主義型ディジタルゲーム AIの拡張と完成
2010年代のディジタルゲームシーンは二つの軸がある.PlayStation4(SIE,2014),Xbox(マイクロソフト,2013),Nintendo Switch(任天堂,2017)とPCを中心にディジタルゲームのオープンワールド化に伴うゲームの巨大化の軸,そして,携帯電話を主とする小型ゲームのサービスの拡張の軸である.前者はゲームAIにとって新規技術ではなく既存技術の拡張を要求し,後者は新たにデータサイエンスがゲーム産業にもち込まれた.以下,2010年代を代表するオープンワールド型ゲームにおけるAIの資料を提示する.
- Francois Cournoyer: Massive Crowd on Assassin’s Creed Unity: AI Recycling, GDC 2015 [34] [35]
都市全体を再現するというのがオープンワールドのだいご味の一つであるが,その中の群衆制御はディジタルゲーム AI技術の一分野である.本講演では,リアリティのある群衆をいかに省メモリ,省リソースで実現するかが解説されている. - Matthew Gallant: Authored vs. Systemic: Finding a Balance for Combat AI in Uncharted 4, GDC 2017 [36] [37]
大規模なゲームの戦闘シーンでは全体のシステム構築と,特徴を出す細部を同時に追求する必要がある.本講演はその手法の一つを解説している. - Laurent Couvidou, Xavier Sadoulet: Taking Back What’s Ours: The AI of ‘Dishonored 2’, GDC 2017 [38]
「ビヘイビアツリー」,「地形解析」を組み合わせた大規模なキャラクタAIシステムとなっている.ビヘイビアツリーの限界点を示した講演ともいえる. - Charles Lefebvre: Virtual Insanity: Meta AI on Assassin’s Creed: Origins, GDC 2018 [39]
ゲーム全体を制御するメタAIの導入例である. - Youichiro Miyake: Eos Is Alive: The AI Systems of Final Fantasy XV, GDC 2018 [40]
これまでのディジタルゲームAI技術の集大成として,人工生命的なゲームキャラクタの AIのつくり方と, RPGで必要なドラマティックな展開のつくり方が融合している. - Adam Noonchester: Marvel’s Spider-Man AI Postmortem, GDC 2019 [41]
広大な空間を効率的にキャラクタに使用させるためにさまざまな空間解析技術が組み合わされている.
§11 台頭する日本のゲームAI
2010年代からは,日本のゲーム産業も世界のディジタルゲームAIのレベルにキャッチアップした.また,意思決定アルゴリズムにおいては独自の工夫が積み重ねられ,欧米よりもリードしている.以下に日本のディジタルゲームAI開発における発表をリストする.これは,欧米のゲームAIがゲームのオープンワールド化に伴い新規技術の導入がストップし,技術的には停滞したことも一因である.
- 長谷洋平:BLUE PROTOCOLの個性豊かなキャラクターを動かす意思決定システム,CEDEC 2019 [42]
ビヘイビアツリー, HTNが階層的に組み合わされている. - 長谷洋平:BLUE PROTOCOLのパーティバトルを支える集団制御AI,CEDEC 2020 [43]
実践的なチーム AI技術である. - 長谷川誠:ゲームAIにおける意思決定と地形表現~『LEFT ALIVE』を事例に紹介~,GDM 37(2019)[44]
HTNの本格的な応用実例である. - 長谷川誠:『LEFTALIVE』における地形表現とナビゲーションAI,CEDEC 2019 [45]
空間解析の技術が余すことなく応用されている. - ボエダ・ゴティエ:キャラクターAIを成長させるためのGOAP意思決定システム,CEDEC 2021 [46]
GOAPをキャラクタの個性的な行動の実現に応用している. - 三宅陽一郎:大規模デジタルゲームにおける人工知能の一般的体系と実装─ FINAL FANTASY XVの実例をもとに─,人工知能学会論文誌,Vol.35, No.2, pp.B-J64_1-16(2020)[47]
『FINAL FANTASY XV』(スクウェア・エニックス,2016)におけるAI技術の全貌が説明されている. - 三宅陽一郎ほか:大規模ゲームにおける人工知能─ファイナルファンタジーⅩⅤの実例をもとに─,人工知能,Vol.32, No.2, pp.197-213(2017)[48]
- 三宅陽一郎:ディジタルゲームにおける人工知能技術の応用の現在,人工知能,Vol.30, No.1, pp.45-64(2015)[49]
2015年までのディジタルゲーム AI技術の解説論文である. - (株)スクウェア・エニックス『FFXV』AIチーム:FINAL FANTASY XVの人工知能─ゲーム AIから見える未来─,(株)ボーンデジタル(2019)[50]
『FINAL FANTASY XV』のAI開発者15名がそれぞれのパートを詳説している.ディジタルゲームAI技術を多角的に全貌するのに適した書籍である. - 大陸新秩序:スクエニやコーエーテクモの第一人者がゲームにおけるAIの現状と未来について語った「FOST25周年記念講演会」レポート,4gamers(2017)[51]
『信長の野望・大志』(コーエーテクモゲームス,2017)では 2階層のゴール志向型AIが採用されている.
§12 機械学習の応用
2010年代後半には,ディープラーニングの隆盛によってゲームとその開発にも機械学習の導入が進められることになった.ただ,ゲームそのものに導入は,メモリと安定性の問題,さらにチューニングの難しさのために,ほとんど進んでいない.ゲーム開発工程への導入例は多数ある.
- Robbins, M.: Using neural networks to control agent threat response, GAME AI RRO, Chapter 30, pp.391-399, A K Peters/CRC Press(2013)[52]
攻撃する敵を選択するアルゴリズムをニューラルネットワークによる学習によって構築している. - Chung, J. and Rho, S.: Reinforcement learning in action: Creating arena battle AI for‘Blade & Soul’,GDC 2019 [53] [54]
格闘ゲームにおけるさまざまな強さのキャラクタAIを強化学習によって生み出している - 泊久信:ニューラルネットワークを用いたAIの格闘ゲームへの組み込み,Game Creators Conference 2019(2019)[55] [56]
『SAMURAI SPIRITS』(SNK, 2019)においてユーザのプレイログからディープラーニングによってプレーヤのプレイの癖を学習したキャラクタAIが生成される. - Leroy, G., Devlin, S., Chan, P. and Schiel, A.: AI Summit:‘Age of Empires IV’: Machine Learning Trials and Tribulations, GDC 2022 [57]
リアルタイムストラテジーゲームにおける機械学習の応用事例である.
§13 キャラクタ対話・ドラマ生成
ゲーム内においてPC(プレーヤキャラクタ)とのNPC(ノンプレーヤキャラクタ)の会話はキャラクタAIの果たすべき役割の一つである.また,ディジタルゲームの場合,自然言語処理の導入は遅れており,どちらかといえば,仕草やドラマシーンのつくり方に比重が置かれている.以下に,いくつかの実装例を示す.
- Ruskin, E.: AI-driven dynamic dialog through fuzzy pattern matching, GDC 2012 [58] [59]
ルールベースの会話の実装例である. - Gregory, J.: A context-aware character dialog system, GDC 2014 [60]
状況や条件によって会話を変化させる手法である. - Tomsinski, P.: Behind the scenes of cinematic dialogues in‘The Witcher 3: Wild Hunt’, GDC 2016 [61] [62]
「カットシーン」とはゲーム内のストーリー上必要なドラマシーンのことであるが,その数は数百,数千となっている.そこでシナリオからカットシーンを自動生成する手法が構築された. - Paradis, F.: Procedural generation of cinematic dialogues in‘Assassin’s Creed Odyssey’, GDC 2019 [63] [64]
カットシーンの製作の部分的な自動化である.キャラクタの会話中の仕草,カメラワークが自動生成される.
§14 ゲーム産業以外のディープラーニング
ゲーム産業におけるディープラーニングの応用のスピードは遅い.それは,ゲーム産業が商品の中にディープラーニングを取り込んで出荷する必要があるからである.ディープラーニングをゲームデザインに合うようにチューニングする手法は見いだされていない.また,学習であるが安定性も求められる.メモリ,計算パワーの必要性など課題がある.実装すること自体は可能であるが,チューニングする技術の探求が必要である.商品に組み込む以外,つまり開発工程におけるディープラーニングは進んでいる.一方で,ゲーム産業以外では,ディープラーニングの強化学習を研究するためにゲームを利用するために,皮肉なことに,ディジタルゲームにおける深層強化学習の応用は,ゲーム産業以外で大きく促進されることとなった.前掲の表1がその一覧である.
上記の表に含まれる内容のリンクをまとめる.
- Research Collection – Reinforcement Learning at Microsoft [65]
マイクロソフトは最も早い時期,2000年初頭から強化学習の研究を推進してきた.これはその歴史である.
「AlphaGo」前夜であるが,1970年代のAtariの六つのゲームを対象にDQNアルゴリズムが応用されている.この成功が後のゲームへのディープラーニングの応用の端緒となった.
MOBA(Multiplayer Online Battle Arena)とは,数人のチームで対戦する俯ふ瞰かん型のリアルタイムストラテジー型のゲームジャンルである.eSportsの一大ジャンルとして大きな人気を博している.賞金も数億を超える.そこで,人間のチャンピオンチームに対してAIチームを対戦させる,というエキジビションが実施されることが多い.「Open AI Five」は『Dota2』(Valve Corporation, 2013)においてOpenAI製作環境のうえに構築されたAIチームである.
リアルタイムストラテジーゲーム(RTS)はディジタルゲームAIにおける一大実験場であるが,その研究環境は,既存のゲームをハッキングする,独自のゲームをつくるがゲームに深みがない,など,なかなか整備されなかった.記号主義型ゲームAIは『StarCraft』(Blizzard Entertainment, 1998)を半ばハッキングする形で構築されたが,ディープラーニング世代のゲーム AIの環境は Blizzard Entertainment社が研究環境,つまりゲームを操作する APIと,ゲーム内情報を取得する APIを公開した.さらに DeepMind社は,その APIのうえに学習環境のフレームワークを構築し公開した.『StarCraft』は徹底的に記号主義型ゲームAIの探求がなされ,『StarCraft 2』では一斉にディープラーニング技術の探求がなされているのは,非常に対照的である.
- PySC2: StarCraft II LearningEnvironment(2017)[69]
- Ontañon, S., Synnaeve, G., Uriarte, A., Richoux, F. and Churchill, D., et al.: A survey of real-time strategy game AI research and competition in StarCraft, IEEE Transactions on Computational Intelligence and AI in games, IEEE Computational Intelligence Society,Vol. 5, No. 4, pp. 1-19,hal-00871001(2013)[70]
- Churchill, D., et al.: StarCraft Bots and Competitions.In: LeeN.(eds.) , Encyclopedia of Computer Graphics and Games,Springer,Cham.(2016)[71]
- Churchill, D.: Heuristic Search Techniques for Real-Time Strategy Games, University of Alberta [72]
- Robertson, G. and Watson, I.: A review of real-time strategy game AI, AI Magazine, Vol.35, No.4, Winter(2014)[73]
DeepMind社による『StarCraftⅡ』のディープラーニングベースのAIである.一応プロには勝利したが,AlphaGoのような衝撃がなかったのは,囲碁と違い,本当にこの対戦が平等な勝負なのかについては,賛否があるからである.例えば,1秒間当たりのコマンド発行数はAIは数千でも可能であるが,人間プレーヤと平等にするために上限数が決められている.
- Vinyals, O., et al.: StarCraft II: A new challenge for reinforcementlearning(2017)[74]
- Microsoft:AirSim(2017)[75]
マイクロソフト社によるドローン AIのバーチャル実験環境である. - Seijen, H. v., et al.: Hybrid reward architecture for reinforcementlearning(2017)[76]
マイクロソフト・リサーチによる『パックマン』を用いた多報酬強化学習の研究である. - DeepMind: Capture the flag: The emergence of complex cooperativeagents(2019)[77]
オープンソース化された『Quake III』(idSoftware, 1999)エンジン上で,DeepMind社は2対2で旗を取り合う「Capture the Flag」ゲームを構築した.協調するエージェントを学習によって構築した.
『マインクラフト』(Mojang Studios, 2011)は北欧のゲーム会社が数人でつくり上げ,1億本を超えるヒットとなったユーザが3D空間やオブジェクトを構築するゲームであるが,現在はマイクロソフト社が権利を買い取り,研究用途でも用いられるようになっている.
- Facebook Research: CraftAssist: A framework for dialogue-enabled interactiveagents(2019)[78]
- Open-sourcing CraftAssist, a platform for studying collaborative AI bots inMinecraft(2019)[79]
Facebook Research(現 Meta AI Reserach)によるマインクラフトにおける会話AIの研究である.
「MineRL」はマインクラフトで強化学習(RL)を行うためのフレームワークである.カーネギーメロン大学が製作し,NeurIPS2019のワークショップでコンテストが行われた.
- カーネギーメロン大学「MineRL」(2019)[80] [81] [82]
- NVIDIA DRIVESim(2019)[83]
NVIDAによる自動運転のシミュレータ.ドライビングAIの学習用に構築されたと考えられる. - Google SoccerSimulator(2019)[84]
Googleによるマルチエージェント学習環境.こちらもディープラーニング強化学習の実験環境として構築された. - OpenAI: Emergent tool use from multi-agentinteraction(2019)[85]
「かくれんぼ」における道具の使い方を学んでいくカリキュラム学習である. - Kim, S. W., et al.: Learning to simulate dynamic environments with GameGAN, CVPR 2020 [86]
画像ベースでゲーム全体の動きを学習するアプローチである.音声はない. - Agent57: Outperforming the Atari human benchmark, Proc. 37th Int. Conf. on Machine Learning, PMLR, Vol.119, pp.507-517(2020)[87]
2013年のAtariゲームの学習を,さらに57個のゲームまで拡張したDeepMind社による研究.
DQNの集大成となる技術体系である
§15 自然言語処理とディジタルゲーム
商業ディジタルゲームにおいて自然言語処理(NLP)が使われることはまれである.また,現在,ゲーム産業ではNLPエンジニアもとても少ない.ディジタルゲームにおける自然言語処理の応用もまた,ゲーム産業外から起こっている.
- Meta AI:LIGHT(2019)[88]
メタ社によるTRPGを題材とした会話AIの研究.クラウドワーカによるロールプレイのテキスト会話をコーパスとする.
TextWorldは,Microsoft Researchによる過去のアドベンチャーゲームを題材として言語学習を行い,また同時にアドベンチャーゲームを生成する研究である.
- Côté, M.-A., et al.: TextWorld: A learning environment for text-basedgames(2019)[89]
- TextWorld: A learning environment for training reinforcement learning agents, Inspired by text-based games(2019)[90]
- Getting started withTextWorld(2019)[91]
§16 スパーシャルAIの形成
「スパーシャルAI」(空間型AI,Spatial AI)は,「ナビゲーションAI」の拡張である.ナビゲーションAIがその名のとおり,キャラクタの誘導を主とするのに対して,スパーシャルAIは,ゲームステージの空間特性を抽出してメタAI,キャラクタAIに知らせる,また,自らが管理する空間においてエージェントを操作することができる.ゲームのオープンワールド化によって最も発展したのが,本分野である.ナビゲーションAIも,それぞれの地形ごとにキャラクタAI,メタAIが対応しなくてよいように,地形・空間情報を抽象化する役割をもっている.オープンワールドによる多様な地形の導入は,スパーシャルAIによるさらなる地形情報の抽出と抽象化を必要としたのである.
- Walsh, M.: Modeling AI perception and awareness in splinter cell: Blacklist, GDC 2014 [92] [93]
クローズドな世界における空間解析技術.ステルスゲーム(潜伏侵入ゲーム)特有の詳細な空間解析が行われている. - Grinsven, P. v.: Player traversal mechanics in the vast world of horizon zero dawn, GDC 2017 [94] [95]
オープンワールドにおけるプレーヤキャラクタの行動をサポートするための空間解析の開発である. - Johnson, E.: Death stranding: An AI postmortem, GDC 2021 [96]
『DEATH STRANDING』(SIE, KOJIMA PRODUCTIONS, 2019)におけるスパーシャルAI.さまざまな地形解析のテクニックが導入されている.空間解析技術の集大成といえる.
§17 スマートシティとメタバースへの応用
一般にオブジェクトや空間が知能をもつ場合には,「スマート」という接頭語をつける.ゲーム産業では,オブジェクト側が知能をもつ場合には「スマートオブジェクト」,空間が知能をもつ場合には「スマートスペース」,地点が知能をもつ場合には「スマートロケーション」と呼ぶ.都市全体が知能をもつ場合には「スマートシティ」という.メタAI,キャラクタAI,スパーシャルAIの三者を動的連携する仕組みは,冒頭で述べたように「MCS-AI動的連携モデル」(Meta-Character-Spatial AI Dynamic Cooperative Model)と呼ばれる.この仕組みは,スマートシティ,そしてメタバース空間の全体のAIの仕組みとして適用可能である.