【記事更新】私のブックマーク「学習・コミュニケーション・言語の創発と進化に対する構成論的アプローチ」


私のブックマーク

学習・コミュニケーション・言語の創発と進化に対する構成論的アプローチ

鈴木 麗璽(名古屋大学)

1.はじめに

 オンライン会議やメタバースなどの多様なコミュニケーション手段の発展,さらにコロナ禍における行動制限も加わり,私達の日々の生活様式が大きく変わる中,人々をつなぐ言語や非言語情報の役割はその質を決める鍵であり重要さを増している.情報の取得過程である学習は基盤であり,その進化の理解も不可欠である.筆者は,現代社会も学習と進化のようなさまざまなレベルの適応過程間の相互作用の延長にあり,その理解は将来の共創的なコミュニケーションの在り方の検討にも役立ち得ると考えている.
 筆者らは,進化と学習の相互作用をはじめ,認知能力の進化,言語と言語能力の共進化,仮想生物による音声コミュニケーションの起源,複雑系としての鳥類の音声コミュニケーション観測,共創的コミュニケーションの実現の観点から構成論的アプローチによる議論を進めてきた.人工生命研究における最近の手法やトピックとともに関連情報を紹介する.

2.学習能力の進化/ボールドウィン効果

 まず,古くて新しい問題であり,本稿の土台の一つとなるボールドウィン効果と関連研究について紹介したい.まだ獲得形質の遺伝の是非が議論されていた19世紀の終わり頃,獲得形質の遺伝がなくても個体レベルの学習(表現型可塑性)が集団レベルの進化に影響し得ることを主張[1]した一人として知られるのが米国の心理学者のBaldwinである.一般にボールドウィン効果(この名称はSimpson が命名[2])は,学習にかかるメリットとコストのバランスによって,当初そのメリットにより適応形質を学習で獲得可能な個体が集団に広まった後,そのコストを減じる方向に働く進化に基づきしだいに適応形質が生得的になる過程(遺伝的同化)[3]とされる.多くの場合この過程によって進化が促進される場合を指すが,より広く学習が進化に間接的に与える影響全般を指す場合もある(言語進化を含む多方面からの議論についてはボールドウィン効果に関する論文集[4]を参照).
 Hinton とNowlan は,ごくシンプルな遺伝的アルゴリズムに基づく進化モデル[5]でこの効果を鮮やかに示し,適度なメリットとコストをもつ学習は適応度地形をなだらかにし,進化を誘導すると説明した.20 ビットの遺伝子列があり,各ビットが神経回路内の結合の状態を遺伝的に表す.そのすべてが“1” の場合にのみ回路はうまく機能し高適応度が得られるが,それ以外はすべて最低の適応度とする.このとき,単純な選択と交叉ではランダムな探索になり正解の回路は進化しない.一方,結合の有無が学習で後天的に決まることを示す“?” を含めた三つの値を遺伝子が取り得る場合,正解の回路を後天的に獲得可能な個体が生じるのをきっかけに,学習のメリットとコストに選択圧が働き,集団がより遺伝的に正解に近い回路をもつ方向に進化する.極めてシンプルなモデルであるが,学習が進化に与える影響を計算論的に初めて示したものとして,計算機科学に限らず,進化発生生態学,いわゆる,エコエボデボ(生態,進化,発生を統合するアプローチ)[6]などの分野で広く引用されている.そして,著者の一人が深層学習において過学習を防ぐドロップアウトを考案[7]したHinton 教授であることも興味深い.筆者らは,本モデルを拡張し,ゲーム論的状況設定[8]凸凹した適応度地形[9]において学習が進化に及ぼす役割を検討し,学習の度合いが進化の各場面において適度に調整されながら進化し得ることを示している.
 実験的には,古くはWaddington によるショウジョウバエの翅の形状の遺伝的同化,発生経路の運河化の研究[10]がよく知られるが,より最近には果実ハエの産卵選好性の学習を題材にして,学習が選好性の遺伝的な進化を促進したり抑制したりする場合があることが示されている[11].これを念頭に,適応度地形の勾配改変の観点から数理的な分析[12]もなされている.また,前述のエコエボデボの枠組みや,表現型可塑性と遺伝的同化に基づく進化[13]の観点から長らく議論が続いている.
 今年の人工生命の国際会議[14]では,表現型可塑性が振動環境での進化を安定化させることをディジタル生命で示した研究[15]が若手研究者の賞を獲得しており,学習と進化の関係は最新のテーマの一つであるといえる.人工知能分野においても,深層学習を含むエージェントの進化計算に基づく設計において,上記のような進化の見方が役立つ可能性がある(関連研究は後述).

3.認知機能の基盤の進化

 ヒト言語の起源(言語のない状態からある状態への進化)と進化(文化進化)にはさまざまな学術的立場・対象・論点・スケール・方法論に基づく多様な議論がある.筆者は,「階層性」と「意図共有」を柱とし,これらの融合としての言語進化のメカニズムの解明を目指す科研費新学術領域「共創的コミュニケーションのための言語進化学」[16]に参加し,その学際性を実感してきた.本稿で紹介する筆者らの最近の研究の多くは本領域からの刺激を受けたものである.なお,領域に関係する言語進化研究の全体像については「進化言語学の構築」[17]を,その中でも,本稿に関連する構成論的アプローチに基づく問題意識や研究例は計測自動制御学会誌特集[18]をご覧いただきたい.また,領域の中心メンバが執筆した“絵本”「ことばと心」[19]も,さまざまな分野の学者が登場し言語に関わるさまざまな問いや論点をわかりやすく紹介している.
 言語能力の進化シナリオを考えるうえで,前駆体と呼ばれる言語能力を実現する土台となる複数の認知能力がいかに進化し得るかは論点の一つである.近年,よく知られるGPT-3[20]や,ごく最近意識や感覚をもつかのようにblog で報告[21]され話題となったチャットモデルであるLaMDA など,大規模データで構築される大規模言語モデルによって実現される高度なAI の進展が著しい一方,学習を実現する基盤そのものを進化的に創発させる試みは人工生命研究において古くからなされてきた.近年の重要な手法はニューロエボリューション[22]と呼ばれる,ニューラルネットの構造と学習則を同時に進化させる枠組みである.特にNeuroEvolution of Augmenting Topologies(NEAT)[23]という,ネットワークの間接表現・種分化による多様性の維持・交叉時の適応構造を保存する仕組みの考案や,神経細胞間の結合の可塑的変化の度合いを調整する化学物質の伝播を模した神経修飾に基づく可塑性の仕組みの導入[24]が,複雑な学習機能をもつネットワークの進化的な生成に貢献している.特に後者はネットワークの「どこが,いつ,どのように学習するか」のような高次の学習を可能にし,必然的にボールドウィン効果のような現象も進化計算の過程で生じ得ると考えられる.
 筆者らは,言語能力の基盤となり得る高次認知機能の一つであるメタ記憶に注目し,神経修飾の仕組みを活用して,自分自身の記憶をモニタリングすることで,忘れたことを理解するニューラルネットをスクラッチから進化的につくり出すことに成功[25]している.さらには,二次学習(学習能力の学習)にかかる選択圧が,環境構造を動的に取り込む心的表象の進化をもたらし得る[26]ことを論じている.高次認知能力への進化アプローチは,ヒトや,サルやラットなどに関する比較認知科学研究に対して,進化的妥当性の観点を提供し得ると考えている.

4.言語と言語能力の共進化

 ボールドウィン効果は言語能力の進化を論じるうえで時折出現するキーワードの一つである.言語にとって学習が切り離せないのは当然であるが,その理由の一つとして,古くから認識され[27]現在も議論のある[28]「孤独な突然変異体問題」を解決し得ることをあげておく.ある(前)言語的情報伝達システムに遺伝的に依存する集団において,潜在的により適応的な伝達を可能にするシステムを利用可能な突然変異個体が出現したとしても,他個体に理解されず集団に広まることができない,という問題である.
 Pinker とBloom は,近年の言語の起源と進化に関する研究の進展の契機の一つとなった論文[29]において上記の問題を指摘したうえで,個体が学習によって後者のシステムを試行錯誤して理解可能である場合,ボールドウィン効果によってより適応的なシステムを共有する集団に進化し得ると主張した.この見方は,学習と進化という二つの適応過程が繰り返し相互作用しつつ,より複雑な言語能力が進化したというシナリオにつながり,近年このような見方が重視されつつある[30].さらに,ゲノム進化と言語や音楽などの文化進化との相関もビッグデータ解析により明らかになってきている[31]解説記事[32])のはこれらの見方を支持する知見であると考えられ興味深い.筆者らは,コミュニケーション能力が繰り返し生じるボールドウィン効果で段階的に進化する[33]ことや,言語空間上に実体化され文化進化する言語集団と言語能力をもつ生物集団の相互作用において,⼀方が他方の進化を駆動する段階的な進化が生じ得る[34]ことなどをエージェントベース進化モデルで示している.
 現代社会のグローバル化が多様性を失う方向に進展するなら,孤独な突然変異体問題が再び我々の前に現れる可能性も否定できない.対面コミュニケーション,SNS 上の情報伝播,SNS 自体の変化や生存競争など,さまざまな相互作用の階層が存在し共進化する中,言語と言語能力の共進化の理解の取組みは,構成論的手法がますます複雑化する情報化社会に対する理解や,将来のコミュニケーションのあり方,可能なシナリオを考える手立てとなり得ると考えている.

5.仮想生物による音声コミュニケーション起源

 仮想生物の進化はSims の三次元ブロック型ロボットによる先駆的研究[35]に始まり人工生命研究の黎明期から続く重要なトピックの一つであり,近年進展が著しい.その理由の一つに柔らかな形態をもつロボット,ソフトロボットへの展開があり,例えば我々はオタマジャクシからカエルのような変態を示す二次元多細胞生物ロボットの進化[36]に取り組んでいる.特に,柔軟な三次元ボクセルから構成されるソフトロボットの枠組み[37]がさまざまな発展を見せている.
 進化手法においても,従来局所最適解に陥りがちであった進化を,より多様な解を収集するQuality Diversity(QD)法(情報サイト[38]),特に,あらかじめ用意した形質特徴空間上で競合するエリート個体を保存しつつ進化させるMAP-Elites 法[39]が多様な生物の形態と行動の探索を可能にしている.また,プラットフォームにおいても,Evolution Gym[40]などのソフトロボット進化の枠組みが整備されており,研究を始めやすくなっている.上記の一連の流れについては,「ALIFE | 人工生命 ─より生命的なAI へ」[41] でわかりやすく紹介されている.
 一方,コミュニケーションにつながる複数個体間の相互作用を想定した研究はまだ少ないようである.コミュニケーション能力の進化に関して,筆者らは,採餌などの行動に伴って必然的に発生する音響ノイズを起源として儀式化された正直なシグナル,ひいては多様な表現を可能にする言語が創発する進化シナリオ[42]を検討するために,体や地面との物理衝突で音を発する個体群が,音を聞いて集合したり,資源を取り合ったり,音響ニッチ仮説(後述)に基づく周波数領域での棲み分けが生じるように進化する枠組み EvoCreature[43]を構築している(人工知能学会誌特集記事[44]).また,言語を含む文化のように生物が構築した環境状態が次の世代に受け継がれるニッチ構築と生態継承を盛り込んだモデル[45]にも取り組んでいる.
 前述のボールドウィン効果のような形態発生が進化に与える影響[46]や,さらに深層強化学習を導入した議論[47],3D プリンタを使って実際にロボットがプリント(ロボットファブリケーション)され実進化する枠組み[48]生体組織としてプリントする枠組み[49]などもあり,総じて仮想生物進化はエコエボデボ研究のための新たな枠組みとしてますます進展しつつあるといえる.さらには,かつて進化計算の国際会議であるGECCO[50]でのコンペを引き継ぎ,今年の人工生命の国際会議では仮想生物進化フレームワークのコンペに関するワークショップ[51]が開催され,盛り上がりを見せている.
 また,新たな仮想生物の表現手法として,ライフゲームを時間・空間・状態に関して連続化し,柔軟な状態遷移関数を表現可能にしたLenia[52]人工知能学会誌特集記事[53]情報サイト[54])も,完全にボトムアップな仮想生物形態の構築手法として注目されている.最近の研究では,機械学習によるルール探索を組み合わせ環境や他個体との相互作用を含む自律的な生物が創発[55]するまでに至っており,興味深い.

6.複雑系としての鳥類の音声コミュニケーション

 ある種の鳥類(鳴禽類)の鳴き声[56]には,繁殖期における近隣個体へのなわばりの主張や異性に対するアピールのための比較的長い鳴き声である歌(もしくはさえずり)と,それ以外の威嚇などの特定の伝達内容や機能をもった短い鳴き声である地鳴きがある.歌は主にオスが歌うとされるが,近年ではメスも歌う種も少なからず存在することやその役割も注目[57]されている.また,シジュウカラの地鳴きには全体の伝達内容が構成要素の伝達内容(警戒や集合)の⼀定のルールに基づく組合せからなる統語構造がある[58]ことや,初めて聞いた音列もルールに基づき正しく情報を読み取ること[59]などが示されており,言語の進化の理解に対する新たなアプローチとして注目されている.
 鳥類の鳴き声はさまざまな面で人工知能・人工生命研究の対象となり得る.生物の自然音や人工音と環境との関わりをさまざまな時間・空間スケールにおいて明らかにする生態音響学[60]において,自然の音風景の主要な構成要素である鳥類の鳴き声は重要な対象である.「鳥は環境のバロメータ」[61]ともいわれ,鳴き声の録音を用いた鳥類の自動行動観測は,自律録音装置の低価格化や普及に伴い,長期・広範囲の行動観測や自然保護などへの応用が期待されている[62].機械学習においても,鳥類の鳴き声はリッチ(複雑)なパターンを含むデータセットとして,抽出や分類課題(BirdCLEF 2022[63]DCASE 2022 Challenge: Few-shot Bioacoustic Event Detection[64])において従来から利用され,深層学習の進展とともに発展している.ごく最近,鳥類研究のメッカであるコーネル大学鳥類研究所の鳥類観測スマートフォンアプリ「Merlin」[65]の鳴き声検出機能をカリフォルニア州の森林で試用する機会があり,リアルタイムに鳴き声が精度良く検出されることに驚いた.国内の種への対応が期待される.
 鳥類では,歌がより伝達しやすいように近隣のなわばりの種間や個体間で同時に歌うことを避ける場合があり,かねてより報告[66]されている(常にそうではなく,鳴き合うなどのさまざまな関係があることに注意).これは,成熟した生態系では共存する各種が周波数帯や時間の重複を避けて音響シグナルを発するように進化するという「音響ニッチ仮説」[67]に沿うものである.筆者らは,このような集団内での動的な行動調整過程としての可塑性に基づく複雑系としての歌う鳥の集団の理解[68]に興味をもち,野外動物音声の位置推定への活用が期待[69]されているマイクロホンアレーを用いたロボット聴覚技術であるHARK(Honda Research Institute Japan Audition for Robotswith Kyoto University)[70]に基づく音源定位・分離技術を活用した,森林などの野外フィールドにおける鳥類の鳴き声観測ツールHARKBird[71]を用いた音声相互作用の理解を試行している.ヨシ原におけるオオヨシキリのソングポストの推定や個体間の時間的重複回避の分析[72],なわばりへの仮想の鳥の侵入を鳴き声のスピーカ再生で再現するプレイバック実験における対象個体の行動傾向の定量化[73]などを行ってきた.最近では,屋外テント内のキンカチョウ集団の空間的な社会相互作用の観測[74]を試み,例えばオス2個体の集団にメス1個体が加わると,個体間の距離関係が変化することなどが定量的に示されている.
 前述の仮想生物の例も含め,人工生命研究においても音響ニッチ仮説に注目した時間・周波数領域における棲み分けの進化などが論じられている.興味深いのは,自然とのリアルな相互作用を念頭に実際に聴くことのできるシグナルの進化[75]を検討したり,実際にニッチを巡って外界と音響相互作用するシステム[76]を構築したりしていることである.筆者らも,鳥類音声の生成モデルにおける潜在空間をエージェントベース進化モデルの遺伝子空間とみなすことで,鳥の鳴き声を実際に聴くことのできる進化モデルを構築し,これと実フィールドでのプレイバック実験などの組合せに基づいた鳴き声の生態的・進化的役割の理解の手法[77]を提案している.これらのような,自然の音風景や生態を複雑系と捉える考え方[78]は,その理解や保護に加え,自然と人工物との音響的な相互作用・コミュニケーションの新しいあり方の模索につながると考えている.

7.共創的コミュニケーション実現への取組み

 主体間の相互作用における言語の創発に焦点を合わせた構成論的アプローチに関しては,Steelsの言語ゲームによる語彙の創発[79]や,Kirbyらの繰返し学習[80]の枠組みにおける文法構造の創発がよく知られる.これらは近年,主に複数の人での課題遂行において,当初は意味のない記号の送受信から効率的な記号体系が創発する過程を明らかにする実験記号論[81]認知言語学に基づく事例[82])において議論されており,情報伝達における記号列の階層構造の利用の創発[83]も報告されている.同時に,主にエージェント間でのコミュニケーションプロトコルの創発を検討する創発コミュニケーションや,相互作用を通じて物理的・記号的環境に自律適応するロボット構築を目指す記号創発ロボティクス[84]においても議論されており,深層学習を含めた大規模なモデル実験も行われている[85].言語的なやり取りが促進される場の解明はコミュニケーションの活性化に有用であるといえる.
 また,主体間の相互作用に基づく長期の文化進化に関して,大規模コーパスなどのビッグデータに基づく解析がなされている.例えば,古英語から現代英語への進化において完了形の表現形式が変化(be+PP からhave+PP へ)したことは従来から知られているが,これが方向性選択圧によるもの[86]であることがデータ解析から論じられている.オンライン社会では,ネットワーク環境がディジタル方言(digital dialect)を形づくることもあり得る.大量のテキストが産出され続けるSNS上の言語進化がいかに我々の言語を形づくるかはその多様性を論じるうえで重要であるといえる.
 筆者らは,コロナ禍で注目される仮想空間でのコミュニケーションのミニマルな場として,SpatialChat,Gather.town,oVice などの近接ボイスチャットにおけるコミュニケーションの活性化に注目している.よく指摘される課題は非言語情報の欠如(アイコンタクト,うなずき,接触)[87]などであり,筆者らはこれが,仮想空間での移動のきっかけの欠如につながり,多様な人々との交流によってセレンディピティを得る機会を失い得ると考えている.そこで,協力集団の生成崩壊過程を表現可能な社会粒子群モデル[88]で会話集団を表現し,活性化エージェントの介入によるより多くの相手との協力的会話の促進方法を検討[89]している.その結果,多数を集めてグループの自発的な解散と再構築を促進する協力的エージェント,ノイズを発してグループを分断し再構築のきっかけをつくる非協力的エージェントの有用性を見出しており,現在は実環境で検討可能な近接ボイスチャットシステムを構築して実験分析を試行中である.このような,エージェントの介入などで人々のウェルビーイングを向上する向社会性計算[90],あるいはポジティブコンピューティングの考え方において,構成論的アプローチは新たなコミュニケーションのあり方を検討する重要な方法論であると考えている.

8.おわりに

 筆者らの研究に関わる観点から,学習・コミュニケーション・言語の創発と進化に対する構成論的アプローチについて,関連するトピックと研究・情報・将来のコミュニケーションとの関わりを述べた.2022年9月には言語の起源と進化に関する2大国際会議であるEvolang[91]Protolang[92]の初の合同会議Joint Conference onLanguage Evolution[93]が日本で開催される.同会議においては,共創的コミュニケーションに対する構成論的アプローチに関するワークショップ[94]が開催予定であり,Frontiers in AIにおいて関連するResearch Topic[95]が立ち上がっている.今回紹介した内容に限らず広く未来のコミュニケーションにおける構成論的アプローチの役割について考える場になることが期待され,興味をおもちの方はぜひ一度ご覧いただければ幸いである.さらに,2023年7 月には札幌で人工生命の国際会議も開催予定であり,国内での人工生命研究のさらなる盛り上がりが期待されるところである.

謝 辞

 本稿を執筆するにあたり,名古屋大学大学院情報学研究科有田隆也教授から多くの有益な助言をいただいた.ここに謝意を表す.