【記事更新】私のブックマーク「擬人化メディアとHuman-Agent Interaction:「情熱」のあるやり取りを目指して」


私のブックマーク

擬人化メディアとHuman-Agent Interaction:「情熱」のあるやり取りを目指して

米澤 朋子(関西大学総合情報学部,(株)国際電気通信基礎技術研究所深層インタラクション総合研究所)

目次

1.は じ め に

1・ 1 擬人化メディアとは〈導入〉

 Human-Agent Interaction(以下,HAIと表記)という研究分野がここ15 ~ 20 年ほど特に賑わい,AI 研究の発達とともに「人らしい」メディアとして多方面で取り上げられつつある.擬人化システムの構成によるインタラクションデザイン,人間の社会的反応の分析,医療福祉への応用など,多々のトピックが幅広く議論されており,そのどれもが「人」の「人らしきもの」に対する感性ややり取りに関するトピックとなっている.この分野は,ざっくりといえば,Human Robot Interaction の分野を内包しつつ,Human Computer Interaction に内包される分野内の一つでもあり(HCI ⊃ HAI ⊃ HRI),コンピュータや人工物を擬人化することで人工的システムの受容性を高める効果が期待されている.
 ここで,擬人化メディアとは,擬人化システムを含む擬人化対象(ぬいぐるみやキャラクタなども含む)により,「対象が,人や動物などのように,物事を感じたりする」と人に思わしめるメディアとする.擬人化システムは,何らかの機能をもつシステムに対し擬人化メディアを付すことで,システムの働きがその擬人化対象により行われていると感じさせるシステム,とする.キャラクタエージェントなど,物理的身体をもたない仮想的な存在を表す擬人化メディアを「仮想エージェント」と呼び,物理的な身体をもっている擬人化メディアを「ロボット/実体エージェント」と呼ぶ.エンジニアリングの視点からは上記の定義で述べていくことになるが,今後の擬人化メディアのさらなる精緻化により,対象を擬人化して捉えさせるメディアというよりむしろ本質的な心をもった存在になっていくと考えられる.
 本稿では,擬人化メディア,擬人化システム,エージェント,仮想エージェント,ロボット(実体エージェント)という語を用いるため,混乱防止のために用語をまとめる.1)擬人化メディアは,擬人化を用いた人間への提示をメインとするメディア(システムに付いていないものも含む),2)擬人化システムは,擬人化メディアを付与された何らかの機能をもつシステム,3)エージェントは,擬人化システムのエージェンシーを重視した呼び名,4)仮想エージェントは,ディスプレイやスピーカの中にのみ表現されるエージェント,5)ロボット(実態エージェント)は,物理的身体と動作機構をもつエージェント,をそれぞれ示すこととする.
 HAI分野におけるエージェントは,人間という外界とインタラクションをもつ自律システムや自律にみせかけるシステム(書籍 人とロボットの〈間〉をデザインする)とされ,人工知能の分野で扱われる自律的な知的エージェントとは異なり,AI を内包するシステムともいえる.この書籍では,「エージェントの三種の定義」として,ロボット(実体エージェント),仮想エージェント,人間と定義されている.このように,人間も精緻なエージェントであり,人間同士のコミュニケーションもHAI研究の範囲に含まれることがわかる.

1・ 2 擬人化メディアの位置付けと現状〈夢・社会的影響〉

 擬人化メディアは,AI の入れ物ともいうことができる.AI が賢いメディアであると思われてきたのに対し,情緒的な機能を有するような仕組みの開発が進む今,擬人化メディアは,これらの機能を内包することで,人間の社会的充足感を与えたり,社会的欲求によって人間の行動変容を実現するメディアとして注目されている.人工的な存在に対し,人間や動物のような頭の働きを実現するには,知覚認知にあたる認識システムや,知的な処理を行う知的システムが必要であると同時に,感情的な処理(c.f. Affective computing)を行うシステムも必要である.さらに,人間や動物は本来生物であり,生理的身体状態と脳の内部の処理は無関係ではなく,相互に作用し合っている.このような生物的身体情動相互作用に関する仮説やその知見も,エージェントやロボット開発に導入されつつある.このような「人や動物を模す」システムは,情報科学をはじめとするさまざまな学問の成果を用いて,さらに精巧に実現されつつある.
 一方,擬人化メディアの中は,外観(外見およびその表現)の精巧さが異なるものが多々ある.サービスやシステムに対し,音声のみもしくは簡潔な外観のみをインタフェースとしてシンプルに付すものは,知的サービスを提供する際に使われていることが多い.例えば,SiriAlexaなどの音声対話サービスは,スマートホームの管理などのシステムにおいてユーザの指示入力をしやすいように導入されている.また,キャラクタエージェントを表示する対話システムは情報提供などのシンプルなシステムにも導入されており,これまでの単純な入出力に対し,シンプルな擬人化メディアによるインタフェースが導入されているといえる.反対に精巧な外観により,ユーザが捉えるシステムに対する「姿勢」を変えてしまう擬人化メディアもある.例えば,ERICAGeminoid-HIGeminoid-Fなどのアンドロイドロボットや,ParoNecoroなどの動物的なペットロボットは,精巧な外見や触感や質感などにより,ふと見た瞬間には「本物」のように感じさせるほどである.
 このようなロボットは,知的なサービスにとどまらず,ユーザの心に寄り添う他者の代理(代替他者)として,AI秘書や介護・教育の中など広い応用範囲で期待が寄せられている.実際,さまざまな擬人化メディアの追求により,Orihimeのような自分の身代わりや,いなくなった人の代わり,およびそれ以外の他者の存在を代理させるような,代替他者としてのシステムの実現に手が伸びている状況といっても過言ではない.
 一方で,HAIでは,インタラクションを高度化させる研究や擬人化メディアの認知的受容性に関わる考察など,多岐にわたるテーマが内包される.その分野内での体系化も現在は十分なされているとは言いがたく(HAIシンポジウム2021企画セッション「HAIの体系化」),研究者間でもHAIに対する見方は異なると考えられる.よって本稿では,あくまで著者自身の捉えるHAIと,擬人化メディアを用いたシステムに関するまとめを記す.

2.擬 人 化

2・ 1 擬人化の起源と仕組みの理論

 そもそもの擬人化は,脅威などに対し畏敬の念を抱いて,対象に意思があると感じたり信じたりしながら生活をしてきたという原始からの宗教の流れにも存在していたといわれている.History of Religion by Paul Kinsellaでは若干風刺的な人間の信仰対象の変遷を表している.科学的には意思をもった存在ではないはずの対象に意思を見いだす原始の人間の感じ方は擬人化の第一歩といえる(人とロボットの〈間〉をデザインする).一方で,子供が太陽や花などに顔を書いたり生きているというように,意思をつかめない対象を擬人化し意思を想定する行為であるともいえる.
 また,原始時代の土偶のように,形をもったものをつくることでその対象を擬人化するという,設計者による擬人化対象の制作が行われてきた.現在でも,亡くなった人の代理となる位牌や遺影など,現実に存在していた人を投影する対象としてのメディアもある.ロボットの設計においてロボットを人らしく捉えてもらうよう設計者が工夫し,擬人化して用いてもらうものもあるが,掃除機ロボットルンバのように,機能を優先して設計された対象にも,人間はときに心や意思を感じるという.

2・ 2 志 向 姿 勢

 このような人間の擬人化感受性機能に関して,哲学者・認知科学者・生物学者のダニエル・デネット書籍「志向姿勢の哲学」において,人間が対象を見るときの見方・感じ方には,物理的現象によって動作するのみの対象であるという物理姿勢,設計されたとおりに動く対象であるという設計姿勢,意思をもって行動しようとする対象であるという志向姿勢があるとしている.例えば,原始的動物や植物が,生物的システムが設計されたとおりに動いているだけと見るのか(設計姿勢),意思をもって生きようとしていると見るのか(志向姿勢)によって,擬人化が解釈者の中に起きているのかどうかが分かれる.

 志向姿勢に関する追加文献

 人工のメディアに対する人間の志向姿勢ともいえるメディアの等式(Media EquationBook: The MediaEquationでは,メディアに表現される・起きていることを現実だと感じる人間の特性を示している.HAIにおけるメディアイクエージョンで触れられているように,HAIにおける志向姿勢は,チューリングテストのように人工物が人間かのように思い込ませる外観やインタラクションを提供するか否かにかかっているといえる.

2・ 3 アニマシー知覚と不気味の谷

 ここで,志向姿勢における意思をもった対象として,「人間」から「生き物」に広げる.対象に生き物だという感覚をもつことを,アニマシー知覚という.動物的な志向姿勢を見いだす知覚ということもできるだろう.この感覚についてはHeider and Simmel が行ったAn experimental study of apparent behaviorにおいて示された,本当の生き物(動物)ではない対象に対する志向姿勢ということもできる.ビデオ「Heider and Simmel Movie」を見ると三角や丸といった単純な形状が棒線の周りで動することがくだけのムービーに,志向姿勢をもった対象を見い出し,その意図を推定実感できる.
 このような人間(や他の動物など)の知覚は,外敵かどうかなど瞬時の判断を求められる脳の機能と考えられる一方,意思をもっている(擬人化して捉えるべき)対象かそうでない対象かの間で揺れ動くことで混乱することもある.これに関係し,不気味の谷現象では,人間に類似してくるほど好感をもたらしつつもある段階から急激に気持ち悪さを感じるということが起こるとされる.この気持ち悪さが何によって引き起こされるかの議論では,連続的状態からカテゴリー知覚的(顔の表情や声などさまざまな刺激から人間が状態を分離的に知覚する現象)に扱う難しさに起因するという説もある(Categorization difficulty is associated with negative evaluation in the “uncanny valley” phenomenon,Categorical Perception).つまり,人工物が人間に似てくるときに起こる不気味の谷では,志向姿勢と設計姿勢の間でカテゴリー知覚的に揺れ動くと考えられる.
 一方このような気持ち悪さやネガティブ感情は,予想を下回る実際の内部機能によっても引き起こされると考えられる.この差を適応ギャップ(How Does the Difference Between Users’ Expectations and Perceptions About a Robotic Agent Affect Their Behavior?)といい,予想する機能より実際の機能が上回るほうが不快感を下げられる.もちろん実際の機能に対する知覚は急激に起こるものではなく,エージェントとユーザの二者間で相互適応というインタラクションを通じた再帰的な対象理解が前提である.

 アニマシー知覚に関する追加文献

 不気味の谷に関する追加文献

 カテゴリー知覚(Categorical perception)に関する追加文献

 相互適応(Mutual adaptation, co-adaptation)/ 適応ギャップ(Adaptation gap)に関する追加文献

2・ 4 心の知覚と身体(生理)

 人間がもっている心の知覚として,計算したり理解するなどの知能としての冷たい(賢い)心,および他者との関わりや自身の感情などの温かい心(情動),の2 軸があると考えられている.Semantic differential scale method can reveal multi-dimensionalaspects of mind perceptionでは,SD 法による因子分析によりEmotion 軸とIntelligence 軸の知覚が示され,これは心の感じ方に関する先行研究Dimension of mind perceptionにおけるExperience 軸とAgency 軸(図1)を肯定すると言える.

図1 心の知覚の2 軸
図1 心の知覚の2 軸

 このようにagency / intelligence とexperience / emotion の値はさまざまなエージェントにより異なると考えられており,適応ギャップはそれぞれの軸に対して存在していると考えると,弱いロボットはこの中のexperience / emotion 軸において正の適応ギャップ(期待以上)となりつつagency /intelligence 軸において負の適応ギャップがあるともいえる(なお,弱いロボットは,HCI 分野では不便益仕掛学書籍「仕掛学─人を動かすアイデアのつくり方」)などにおける人間の行動変容デザインにも関連する).
 実際にはこの2 軸が完全に独立かどうかは不明である.例えば,ソマティックマーカー仮説,[ The somatic marker hypothesis and the possible functions of the prefrontal cortex]では,人間は本来生物であり,生理的身体状態と脳の内部の処理は無関係ではなく,相互に作用し合っているとしている.本能的な心は知能・理性の対極として捉えられるが,身体との相互作用のある心がexperience / emotion にあたり,独立的な知性の心がagency / intelligence と考えることもできる.ソマティックマーカー仮説は,情動だけでなく,意思決定をする知能・理性にも身体状態(およびそれと相互作用のある情動)が影響するという考えだといえる.
 一方,著者らはこのような身体と切り離せない心をもつかのように振る舞うエージェントデザインとして,呼吸や心拍鳥肌といった,本能に基づく生理的な現象を表すロボティクスに取り組んでいる.

 弱いロボットに関する追加文献

 ソマティックマーカー仮説に関する追加文献

2・ 5 共感と擬人化

 人間が他者に共感するとき,ミラーニューロン(他者の行動を見たときと自分の行動の両方で反応する脳の賦活)の働きが作用しているとされる[The ‘shared manifold’ hypothesis. From mirror neurons to empathy].一方,情動伝染(Emotional contagion)は他者の情動を見ることが自分の情動に影響するという現象で,行動や状況に応じて間接的に共感するのとは異なり,より直接的に共感している状況ともいえる.他者の情動が視覚的には顔表情,聴覚的には音声韻律から読み取られ,情動伝染が起こりその情動が表出されることで表情模倣が起こる.表情模倣を利用してユーザの心的状況を変化させる扇情的な鏡は自身の顔画像をベースとしているため,他者に対する共感とは異なるが,エージェントの情動伝染効果を示すものといえる.

 情動伝染や表情模倣に関する追加文献

3.擬人化システムの構成

 擬人化システムは,冒頭で述べたとおり,擬人化メディアを付与された何らかの機能をもつシステムで,エージェンシー:ユーザに対しエージェントを想起させユーザの社会的反応を誘発するシステムの振舞い(ヒューマンエージェントインタラクションから見る人工物・人工システムのエージェンシー)を有効活用し,ユーザの受容性(Design for acceptability: improving robots’ coexistence in human society)や理解度を高めていくことが望ましい.
 つまり,擬人化システムをつくる際は,ユーザに社会的反応を誘発させるための仕組みとして,あらゆる「人らしい」機構が備わっていることが必要であり,「人工のヒト」をつくると言っても過言ではない.そのためここでは,HAI研究における擬人化システムの開発を大きく分けて,身体性・知能(知覚認知システム,内部状態,社会性)の視点から,代替他者を果たしていくために考慮すべきデザインのポイントや,これまでの研究例を取り上げる.偏りはあるかもしれないが,筆者の考える擬人化システムのデザインでは下記のように分類する.

  • 架空の存在の外観をデザインすること:身体性のデザイン
    • 髪型・顔・体型などの外見
    • 動き方,視線,声などの振舞い(表現)
  • 架空の存在の機能をデザインすること:対話性・自律性のデザイン
    • 知覚,認知などの認識
    • 性格,興味,理解度,考え方などの知能
    • 人間関係やその関係性形成などの社会性
  • デザインに伴うセンサ系・アクチュエータ系の設計
    • 上記が実現する感受性(センサ系)と,その表現を行う駆動システム(アクチュエータ系)

 HAI 研究における基礎的な擬人化システムに関する追加文献

3・ 1 身体性としての外観(表出機構)

 ロボットは実体をもち我々と同じ空間に存在している.一方仮想エージェントはディスプレイなどを通して垣間見えるバーチャルな世界に存在している.このようなエージェントたちには,身体性,(Embodiment)がある.身体性により,ユーザが志向姿勢でエージェントを捉え,社会的反応を引き起こしやすくなる.また一方で身体性の中でも物理的身体性をもつことは,外界の理解や物理的接触を可能とする.特にHAI研究で扱う身体性は,視覚的・聴覚的・物理的な具現化によりエージェント自身の意図や意思に伴った行動を示し,ユーザの社会的反応を引き起こす.冒頭で述べた用語の定義としては身体性=擬人化メディアであり,人間とのインタフェースを司る.つまり,後述する機能(知覚認知システム,内部状態,社会性)への入力と出力(表出)を担う器官となる,擬人化システムの要である.
 身体性のないエージェントとしてELIZAなどテキスト対話エージェントも存在するが,音声対話エージェントは声の特徴により老若男女のキャラクタを聴覚的に具現化することでその身体の存在と心や内部機構の存在を想定させる.また,視覚的な身体性をもつ仮想エージェントおよびロボットは,外見と振舞いが具現化されることにより身体を伴う表現をすることが可能であり,老若男女に限らずさまざまなキャラクタの外見を表示したり,人間が視覚的に提示するような顔表情や身体動作を実現できる.中でもロボットは,物理的な身体性をもつことでその存在性を強めたり接触などの物理的インタラクションを可能とする.
 上記のようにエージェントの身体性には複数の要素があるが,実在ロボット・遠隔で表示されるロボット・仮想エージェントを比較した研究では,実在ロボットと遠隔で表示されるロボットの間では存在性(presence)が異なり,遠隔で表示されるロボットと仮想エージェントの間では物理的身体性(physicalembodiment)が異なるとしている.

図2 ロボットの身体性と存在性
図2 ロボットの身体性と存在性

 聴視覚的身体性をもつエージェントは,表情やジェスチャなどさまざまなモダリティを活用して表現を行うことができる(マルチモーダル表現・マルチモーダルインタフェース).また複数のモダリティの組合せによる相互作用(クロスモーダル表現)によりさまざまな効果を狙うこともできる.
 前述の適応ギャップで述べたとおり,外観の精巧さと擬人化システムに求める機能には相関があるとも言えるが,必ずしもこの外観が精巧であればよい訳ではない.ロボットデザイナ(ex. 園山隆輔書籍「ロボットデザイン概論」─,松井龍哉 etc.)は,さまざまなロボットの実用シーンにおけるニーズを把握しながらその身体性をデザインする職業の方達である.ロボットや仮想エージェントの設計では,外見(Appearance)と振舞いとしての動作(Expressive motions)は切っても切り離せない関係であるため,それらの振舞いを考慮しながら技術的設計者とデザイナがその外観をデザインしていく.

 ロボットの身体性に関する追加文献

 人間や動物に似せた顔をもつエージェントにはその視線や顔表情による感情表出表現がある.仮想エージェントでは3D または2D 表現によりこれらを構成することができるためロボットに比べ容易であるが,ロボットではkismetiCat: an animated user-interface robot with personalityのように顔の上のパーツを物理的に制御するものやMaskbotLOVOTのように顔表情や目の表現のみディスプレイに頼るもの,瞳孔表現をするものもあり,リアリティとコストが比例する中で研究目的に応じてミニマルデザインされる傾向がある.
 ロボットの物理的身体性には,空間共有状況下でMeet me where I’m gazing: How shared attention gaze affects human-robot handover timingなど指さしやMeet me where I’m gazing: How shared attention gaze affects human-robot handover timingなど視線による空間情報を伴ったインタラクションを実現することができる(リアルなロボットの視線]).仮想エージェントには一般的には不可能だが,一部エージェントユーザ視点位置に応じた描画エージェントを用いた実空間内注視コミュニケーションの検証ではVR と裸眼立体視を用いた擬似3D 空間を現実空間の座標系に接続することで空間共有インタラクションの実現を狙っている.一方,仮想エージェントには物理的な接触が不可能である.ロボットにおける接触を伴うHAI研究として,The hug: An exploration ofrobotic form for intimate communicationなどソーシャルタッチに関する研究が広がりつつある(ソーシャルタッチの研究プロジェクト).人間に似せた触感のシリコン皮膚をもつアンドロイドにも将来的にこのような機能が搭載される可能性もあるが,どのような表現や振舞いがユーザにどのように解釈されるかについての議論がまだ必要な段階である.感情的な動きの再現Geppetto: Enabling semantic design of expressive robot behaviorsではロボットの動きと文脈を結び付けて学習した結果の動き自動生成が提案されている.
 一方,振舞いの中に含まれる聴覚的身体性としての音声表現がある.感情音声(感情音声合成音声からの感情の認識)や個人性音声合成・認識 などさまざまな研究によりText-to-speech からよりパラ言語要素の含まれたリッチな音声表現が実現しつつある.歌声合成(歌声合成とその応用)を用いたバーチャルアイドル初音ミクなどは表現力をユーザの創造性に寄与させる製品としてもリリースされている.ここではさまざまなパラ言語要素(イントネーションプロソディなど)や言語的表現についてはそれぞれ音声研究や言語研究の分野で詳しく扱われているため割愛する.

 指差し・表情・視線・目の表現に関する追加文献

 身体接触表現に関する追加文献

3・ 2 知能(内部・AI デザイン)

 人間がもっている情報処理機構はAI技術の中で語られるため,ここでは人間らしい情報処理のための基礎的構造に簡潔に触れるのみとする.

§ 1 外部センシング(知覚認知システム)

 人間を含む動物はさまざまな感覚器でリアルタイムに外的状況を獲得する.視覚情報,聴覚情報を処理する機能に関する画像処理技術,音声処理技術は深層学習技術でさらに発展しつつある.ロボット聴覚など,エージェントの状況に応じた信号処理技術に関する分野も発展している.
 一方,触覚センシングは筆者がAnalyses of textile pressure-map sensor data of a stuffed toy for understanding human emotional physical contactで処理技術を検討したが,視聴覚に比べ研究例や技術の充実は弱い.Topography of social touching depends on emotional bonds between humansのように人間の間で行われる接触に関する分析をベースに今後発展していくと考えられる.
 外界理解においては,要素を認識していくことだけでなく,上位レベルとしてさまざまな社会的状況理解や他者の心理的状況理解までを実現することが,共感や社会的行動につながる重要な認知機構となると考えられる.

§ 2 内部状態

 人間に起こる内部状態や内部処理の機構に関し,特にHAIにおいては他者との関係に関わる知能に焦点が当てられている.人間は認識により得られた外部状態が自らに良い状況かに応じ,身体に直結した本能的情動や感情が起こる.例えば他者からの情動伝染は他者とのインタラクションを通じた感情理解による内部状態の変化である.Russell が提唱した感情円環モデルではこの感情状態をpleasure 軸(快不快)とarousal 軸(覚醒度)の2 軸において連続的に表すことができる.一方Ekman は感情を不連続なカテゴリーに分けて扱った.
 エージェントをデザインし実装する際に,このいずれのモデルに基づくかにより性格特性のデザイン手法も異なる.例えばEkmanの不連続なカテゴリーをベースとして,マルコフ過程の状態遷移を用いた遷移確率の調整を行うことで,悲しみやすい性格や喜びやすい性格などの性格特徴を再現できる.Russell の連続性のあるモデルであれば,パラメータの比重をキャラクタごとに変更するなどにより実現するだろう.また,理性的な性格は,内部の感情状態が判断を鈍らせない程度の勾配で変化するにとどまったりリミッターがある状態をつくればよいと考えられる.

 次に,何らかの判断をしたり実行に移すなどの行動を引き起こす欲求として,内発的動機と外発的動機が必要である.外発的動機は外部の状況により行動が引き起こされるが,内発的動機はエージェント自身がもつ動機とされる.このような動機をもつことで「ほしいけれど我慢」といったさまざまな内部状態をもつエージェントが実現可能になる.

 感情に関する追加文献

 内発的動機に関する追加文献

 自然言語処理分野における対話システム研究はAI 研究の一端として広がりを見せているが,特に他者とのつながりを重視した雑談などの対話は,目的や正解のみがある情報提供型対話とは異なり,HAI研究に関係するゴールをもっている.対話知能学はこれらの知能を統合したインタラクティブなエージェントの高度化を目指すプロジェクトといえる.

§ 3 社会性

 エージェントの社会性は,人間ユーザである他者を理解する機能,および自らの立ち位置を決定したり変化させたりする機能ともいえる.例えば,教室や雑談などの会話の中でどのように参加しているかという立場(参与構造多人数会話における参与構造分析, Participating with limited communication means: Conversation analytical perspectives on the interactional management of participation structures)やその立場に応じた適切な表現・発言に関わる話者交替発話交替など,他者とのコミュニケーションを行う際の発言に関わる立ち位置は三人以上のコミュニケーションにおいて非常に重要である.
 一方,コミュニケーションを行う際の重要な文脈の一つとして,社会的関係性がある.複数の人間が対話を行う前提として相手の存在をテンポラリに位置付けるのが上記の参与構造であるならば,バランス理論は,長期的関係性と,他者と他者の関係性が及ぼす影響に関わる,他者の長期的位置付けといえるだろう.バランス理論では,単純化した一対一の関係性が複数存在する三人以上の関係において,図3 のようなそれぞれの間柄における複数の関係性がUnbalancedな状態にあると,Balancedな状態を目指して関係性が変化しやすいことを表している.

図3 バランス理論における3者の関係
図3 バランス理論における3者の関係

 ソシオン理論に基づいたクラス内のいじめと同調方略のモデル化などの研究では,ソシオン理論とこのバランス理論を用いた人間関係の変遷のモデル化を検討している.ソシオン理論は1990 年の関西大学社会学部紀要において発表された.ニューラルネットワークにおける素子がニューロンであることからソーシャルネットワークの素子をソシオンと名付け,社会の中の参加者それぞれに対人関係のモデルが存在している.
 長期的に変動する人間関係や,各個人がもつプロパティに応じて,これらのモデルにも影響があると考えられ,エージェントが人間以上に人間関係を理解したり,弱い立場にあえてなっておくことで人間社会を円滑にするなど,さらなる研究の発展が望まれる.

 バランス理論に関する追加文献

 ソシオン理論に関する追加文献

3・ 3 フィールド応用と発展,製品

 HAI研究をさまざまなフィールドで応用するシーンが増えてきている.一方で新たな応用の可能性は,当然ながらシーンとターゲットユーザの選定を行ったうえで検討される.HAI研究分野でよく取り扱われるフィールドとしては,教育(教室環境幼児障がい),介護支援(施設,自宅),商用施設(スーパーショッピングモールなど),家庭内,などがあげられる.教室環境では,人間の社会関係の分析とそれに応じたエージェントの振舞いによる人間関係の改善や個々の支援,商用施設では,ディジタルサイネージにおける情報提供にあたる機能やさりげない買い物支援など店員の代替,など,人間の社会に入り込むHAI研究の応用が望まれる.その一方,介護シーンでは,高齢認知症患者の社会的ひきこもりに対するコミュニケーションの機会の創生,家庭内では,孤独の解消や娯楽,など,個人ユーザに向けたパーソナライズドなサービス,医療・トレーニングなどの福祉分野では,医療者やトレーナを代替するエージェントが求められる.
 家庭内個人向けの擬人化システムは長い間取り組まれてきた(Aibo etc.)結果として,製品化されたものが多い.ぬいぐるみに対話機能を付与するPechatQooboLOVOTなどの愛玩系ロボットは近年リリースされた愛着をもたせるデザインの家庭用ロボットシステムである.個人の利用シーンに応じた価格帯と外界理解や内部処理のレベルは,今後もさらなるバリエーションをもって多数の製品がリリースされると考えられる.その一方,医療福祉分野で現在リリースされている製品は,物理的な歩行トレーニング支援介護支援といった作業支援ロボットが目立つ状況となっており,個人用のロボットにおけるHAIの浸透状況とは異なる.このような現状を踏まえ,各フィールドにおいて必要なHAI技術の実用が急がれる.

4.HAIにおける状況

4・ 1 他分野との相互作用,およびHAI研究の体系化の難しさ

 上記のように認知科学や心理学,神経科学,脳科学,言語学などの分野から得られた知見や理論や仮説を,人工知能(情報科学)をベースにしつつ擬人化システムに組み込んで,工学的に擬人化システムを改良したり,構成論的に検証するなど,HAIは多くの分野にまたがる研究分野である.また,発達心理学・神経科学・医学などとも関係があり(計算論的神経科学計算論的精神医学研究室),エージェントの心を構成したり人間の心の仕組みを取り入れたりするなどの点で他分野との相互作用が大きい.HAIにおける外観や身体のデザインや製品化においてはロボット工学,美学,デザイン学も関係しており,応用シーンとしても医学,看護学,教育学,介護福祉学,経済学など,複数の分野に波及効果がある.
 HAIの基礎に関連するトピックを取り上げると,擬人化という心理的状態の分析解明が多く取り扱われることとなり,実際,HAI分野の研究においては認知科学者の占める割合は大きいが,今後はHAIからのアウトプットに関連する他分野におけるHAIの取組みが増えることが期待される.
 このようなHAI研究のトピックを鑑みると,他分野に広がるテーマであるがゆえに,HAI研究という学問を体系化する難しさに対面する.HAIシンポジウム2021 企画セッション「HAIの体系化」では,研究者ごとに体系化への提言が異なっており,HAI学という学問を考えるときの像が不確定さを維持しているといえる.立場の違いによりHAI研究の追求ポイントも異なる.例えば,人間の心の仕組みや反応にさほど根ざさない,システムとしての提案も多々あるが,HAIにおける学術的な議論は最終的に認知科学や心理学的側面なしには語ることができない.するとシステムとしての議論をする土壌が少なく,工学的な議論を他のコミュニティに任せてしまう側面もある.一方で,構成論的立場やデザイン学的立場などさまざまな研究者が集うため,相互に刺激を受け新しい研究テーマが立ち上がるなど,学際的領域ならではの創造性にも満ちている.
 一つ一つの研究のオリジナリティの在り方は議論の余地が多いが,HAI研究におけるオリジナリティヒューマンエージェントインタラクションの研究動向も参考にされたい.

4・ 2 HAIにおける課題~ロボット・仮想エージェント,および人間の解明と発達~

 HAIでは,擬人化メディアとのやり取りにおいて人間ユーザが感じるさまざまな課題や,擬人化メディアの改善に向けた人間と人間のコミュニケーションの仕組み自体の研究など,広く扱われている.擬人化メディアを用いたインタラクションデザインとしてのHAIには多くの課題がある.擬人化メディアを構成するうえでの課題や対話性能や認識性能といった知的な問題解決とは別に,インタフェースの観点や実用の観点から下記があげられる.

§ 1 インタフェースとしての必然性

 玩具菓子(食玩)におけるおまけのおもちゃと菓子の関係では,菓子自体を楽しむためのツールとしておもちゃが存在しているとは限らない.同様に,システムにとってユーザインタフェースとして擬人化メディアが必然性をもっているとは限らない.初音ミクユニティちゃんのようなバーチャルアイドルの擬人化メディアが,歌声合成や3D ゲーム開発へのモチベーションを高め,ユーザ人口を増やすことに貢献するのも一つの効果として認められている.擬人化メディアの適用にはこのような効果が期待されていることも,今後さらにHAI技術が求められることを示しているといえる.
 一方で,音声対話システムに対しビジュアルの外観を付与することで,対面対話エージェント(Galatea システム)にして対話性を高めるなど,擬人化メディアの必然性が高いシステムがある.これは,システム自体を利用する際,対象に人格があると思いながらやり取りするほうがスムースな場合である.特に,ユーザの心に寄り添ったり,対話的にサービス提供するようなシーンを想定すると,操作的に扱うのではなく,擬人化して扱うほうが望ましい.HAIでは,この親和性をできるだけ利用し,ミスマッチを防ぎながらシステムを構成していくことが求められる.

§ 2 受容性に向けた自然さや精巧さ

 自然であることは,人間がシステムを受け入れる(Acceptability)ための一つの重要なファクタとなる.そのために,さまざまな擬人化メディアを精巧にしたり,精巧さには一方で不気味の谷(Uncanny valley effect)問題がある(Wired の不気味の谷を検証するロボット).これは,できるだけ自然に本物に近づけようとして人間に似せていくと,本物に近いポイントで気味が悪いという感覚を引き起こすという説である.前述のとおり,この現象を説明する説としてカテゴリー知覚的に引き起こされるという説もあり(Burleigh らによる「A reappraisal of the uncannyvalley: Categorical perception or frequency-based sensitization?」),知覚認知の機構と擬人化が大きく関わることを示す.受容性に向けた自然さやリアリティおよびデフォルメは,ユーザ特性や相性を鑑みながら,外見だけでなく振舞いや性格にも求められていくと考えられる.

§ 3 人間や動物自体,およびそれらのインタラクションの仕組み解明

 前述の自然さや精巧さを細緻に実現する中で,HAIの設計において,擬人化システムが外界をどのように認知・情報処理するべきかという課題に対する一つのアプローチとして,人間や動物が実際にどのように他者とのインタラクションを実現しているかを解明する研究課題もある.例えば,工学的に問題解決する新規のアルゴリズムを考案することと並行し,ヒューリスティクス的に人間が行う情報処理を再現することで,それらの強みを鑑みたシステムがつくられるように,HAIの研究課題の中には「人間自体を対象とした」研究も多く含まれる.
 その中にはゲームのルール内においてどのように人間が反応・行動するかを細緻に調査する研究がある.例えば,書籍「人狼知能:だます・見破る・説得する人工知能」のように,人間との騙し合いにおいて,心があるふりをする人工知能が人間にどのように捉えられるかを検証する研究や,人間とエージェントの発話交替(Turn-taking)の態度表示による発話交代シミュレーションゲームなど,マルチモーダルな表示による人間の社会的反応の解明を目指す研究もある.

§ 4 人間と擬人化メディアの立場のギャップ

 人間に対し擬人化メディアを用いたシステム,その存在(エージェント)の社会的な立場をどのように設定するかという課題がある.例えばマネージャエージェントであれば対等より発言力を強めることになるし,秘書エージェントはユーザの支援をする立場で,ユーザがよほどの規範逸脱を犯さない限りは支援し続けることになる.営業エージェントであれば客先における姿勢は丁寧でなければならない一方で,自己開示姿勢によるユーザの軟化を求めることも必要となる.この問題はグループエージェントを扱う際により複雑になる.また,複数ユーザに対応する際はそのユーザ感の関係性理解が重要となる.
 また,下記の倫理的課題にも関係するが,映画AIに出てくるような,立場の乗取り問題を危惧する視点もある.これは,擬人化システムに自律性や自己愛,社会性などを備えていった結果として,人間に大切に扱われていないなどによる不快さが元となって,人類全体に対する対抗心が生まれてしまうケースを予想したものと考えられる.

§ 5 倫理的課題

 受容性の向上に向けて,仮想エージェントやロボットのインタラクションデザインを精巧にするなどにより,擬人化メディアが心の拠り所であるパートナになることで,人間の信頼を得ていくことになる.すると,そのメディア自体をデザインできてしまうことによる危うさが発生する.ロボット倫理学wiki(参考:ロボット倫理学の現在)は,ロボットにおけるこのような危うさを取り扱う分野の研究で,ロボット三原則(参考:ロボット三原則+ AI 七原則)から広がり発展していく擬人化メディアの設計指針に,重要な指南を与える分野となっている.
 擬人化メディアには,ロボットに限らず,ユーザが心の存在を信じてしまう危うさがある一方,ロボットは物理的身体により物理的危険をもたらすリスクがある.これらを鑑みて下記のような課題に対し包括的にHAI倫理学が構成されていくことが望ましい.実際,それぞれの課題に対し,人工知能を含むテクノロジーの進化に対応しながら哲学,心理学,工学などさまざまな分野から検討されてきている.

  1. 架空と実際の違い:架空の出来事を演出できてしまう仮想エージェントによる,ユーザの現実認識のずれにどのように対応するか.
  2. ロボットなどの人格っぽいものをもったものの行動規範と制限:ユーザに対して不快感や危険を与えないなどの行動規範はいかにあるべきか.
  3. 責任の所在:誰がその指示を出したのか? エージェント自身なのか,設計者なのか,ユーザとのインタラクションの中で決定したことか.
  4. エージェント自体の権利(人権? ロボット権?):その擬人化システムが不快に思ったり危険を感じたりするような状況は人工物だから許容されるべきなのか.人間ユーザから見ても不快なことなのではないか.

 エージェントが他者を思いやる規範をもち振る舞うことと,エージェント自身の自由や多様性の保障は,人間が法律,社会などにおいてそうであるようにトレードオフでもある.よって,今後のロボットや仮想エージェントを含む擬人化システムでは,システム自身が「意識」していくべき規範や倫理を,現状の周辺環境や社会情勢に応じて流動的に解釈しつつ,逸脱行為を避ける仕組みが必要である.
 文献としては「ロボットからの倫理学入門」などがわかりやすいと思われる.

§ 6 応用フィールドにおける課題

 HAIを適用した応用はさまざまなフィールドで行われている.教育・介護・看護・トレーニングなど,エージェントからのさまざまな働きかけがユーザに「相手の心」を感じさせ,行動変容をもたらすことを狙っている.これらに共通していえるのは,HAI技術によって,誰がどのように助けられるか,という明確な目的・ビジョンが必要である点である.そして,他者の存在が必要なのに存在できない・しにくいシーンを選定し,人材不足を解消することになる.しかし,ユーザの個人性はさまざまで,求めるエージェントの性質は異なるため,応用製品などを画一的デザインでリリースすることは望まれない.また,周辺の環境やユーザの社会状況を鑑みた包括的最適解デザインのエージェントが,最も受容性を高めるといえる.このような多目的最適化のような取組みはいまだ多くないため,市場へのHAI技術の浸透に向けて取り組まれたいテーマの一つとも考えられる.
 また,介護施設や商用施設などプライバシーの問題を抱えるフィールドにおける研究の実施はそれ自体が難しく,取得データのプライバシー考慮における制限やデータ処理の必要性,および特殊で自動認識の難しいデータにはラベリングの必要がある.エージェントの導入に対する受容性の問題から対照実験を行うのも倫理的課題として容易ではない.よって,HAI研究自体への世の中の受容性を高めながらフィールド実証実験と商品化などの実用を両輪で進めることが必要不可欠であると考えられる.

5.HAIに関連する学術コミュニティ

5・ 1 会議系

 HAIに関連する国際会議や国内会議のコミュニティが存在している.最たるものが下記のHAIとHAIシンポジウムといえる.しかし多岐にわたる分野に関連しながら発展しているコミュニティであるため,いくつかのコミュニティとその特徴などを述べる.

  • HAI:Human-Agent Interaction のコミュニティは,国内のHAIシンポジウムを発端にエージェント関係の会議の中ではトップカンファレンスに連なる重要国際会議となった.2013 年から開始され,2021年には9回目となる今年,Covid-19 により昨年に引き続きオンライン開催となるか3月末時点では未定であるが,日本国内,名古屋での開催が予定されている.採択率は40%以下で,参加国も年々広がっており,国内でのHAIシンポジウムと連動しながらも,HRIコミュニティや心理学・神経科学など多岐にわたる研究者が参加し,多様なワークショップも併催されている.ACM系.本稿はこのコミュニティをメインとする著者が執筆しているため,下記のリンクは参考までに付けているが,どれも重要で関連深いといえる.
  • HAIシンポジウム:上記のとおり,HAIの国際会議と深くリンクする国内シンポジウム.2006年から開催され2021年で15回目の開催(HAIシンポジウムの過去開催分までのリンクのあるプロシーディングス).
  • HRI:Human Robot Interaction は,2006 年からACM の国際会議として開始している.HAIと類似分野でありつつ毛色が違うのは,ロボットが実世界に身体をもつエージェントであるがゆえの,制御動作に応じた空間を介したインタラクションや,実世界の我々の生活を物理的に支援するシステムなど,新規の実世界インタラクションに踏み込む研究や,それらが人間の認知や解釈に与える影響に関する検証が多く含まれる点である.
    • RO-MAN:IEEE系,30回目.広くRobot and Human Interactive Communicationを扱う.
    • ICSR:Social Roboticsの国際会議.
  • CHI:言わずと知れたACM SIGCHI.1982年から開催されている老舗会議で超難関.デバイス構成からインタラクション分析まで広く取り扱うため,参考研究を見つけるには良い.また,HAI分野からの投稿・採録もある.
  • ICMI:Multimodal Interfaceの難関国際会議.2021年で23回目になる.マルチモーダル情報による人間の状態認識がメインであったが,近年はエージェントやロボティクスに関する投稿もある.
  • その他ロボット系
    • ICRA:Robotics and Automationの分野,超難関.
    • IROS:Intelligent Robots and Systems.1988 年からの老舗会議.非常に分野が広く,参加件数が多いため,国際会議の中でも全国大会のような雰囲気もある.
    • RSJ:(IEEE,日本ロボット学会)系.
      • 国内ではロボット学会が広くロボットを扱うメインの学会.全国大会などさまざまな発表の機会がある.
  • Agent 系:IVA:ACM.2007年から開催,21回目.2005年までは隔年開催だった.Second Lifeなど仮想世界でのやり取りを多く扱ってきている.
  • IEEE VR:IEEE.1993年にシンポジウムとして開始したのち,1999年から国際会議になっている.仮想エージェント関連でVR に関する国際会議にも複数目を引く研究がある.ほかにもVR 系国際会議は接触に絞ったものなど多岐にわたるが,ここでは省略する.
  • その他
    • AIVR:Artificial Intelligence and Virtual RealityなどもAIとVRという点では関わりが深い.
    • AAMAS:Autonomous Agents and Multiagent Systems. AI的側面が多かったが,徐々にHAI的なコンテンツも増えている.
  • ジャーナル(本稿の論文リンク先ジャーナルなど下記のほか多数)
5・ 2 その他国内会議や研究会などローカル系

 上記のほかにも国内の会議や研究会などのコミュニティがある.HAIにのみフォーカスを当てる研究会は存在していないが,多岐にわたる分野が関わっていることを一部のリンクにより示す.これら以外にも関連するコミュニティがあるため,追記や編集をしていくべき箇所といえる.
(基):基礎的なHAI 構成に関わる,(応):応用フィールド,(展):発展および転回的フィールド

5・ 3 研究プロジェクト・組織系

 大型予算を取っている研究プロジェクトは全国に数々存在しているが,HAI に関わる特徴的な視点をもつ研究シリーズとして成果をおさめているものがあるため,ここに新旧いくつかを取り上げる.

5・ 4 研究室など(高校生・受験生向け)

6.お わ り に

 本稿ではHuman-Agent Interactionにおけるトピックの整頓や関連する研究コミュニティの紹介を行った.シンギュラリティがAI分野で一時期強く取り上げられたが,情報技術のインタラクションデザインにおいては,知的支援と情緒的共感の2 方向に分かれた研究開発ののち合流していくと考えている.その際にある脅威を強く感じる人も多いが,人間の情緒的・社会的QOL を高めていく希望でもあり,SDGs的にそのQOLをさまざまな人に保障する技術的革新をもたらす可能性もある.
 人間の代替としてのエージェントと人間以上の人間を求めるような高度化とは別に,いかにユーザの生活を豊かにするかという観点をもち続けることで,脅威のリスクに向き合うこともできる.人間ユーザの「情」を満たすメディアとして,さらに,擬人化メディア自身の「情」を含みつつそれも満たすメディアとして,人間だけでなく人工物のQOLも向上させるような共生的未来を,研究者や開発者全員が真剣にデザインし続けることが,HAI分野において今後必要不可欠となるだろう.
 最後に,文献・リンク類はあくまで抜粋であり,HAI関連分野が非常に広いことを鑑みつつヒントとしていただけることを願う.

謝 辞

 本研究は科研費19H04154,19K12090,18K11383,JST,CREST JPMJCR18A1,および2019年関西大学研修員研修費の助成を一部受け実施したものです.執筆に際して有意義な資料やコメントを下さった大澤博隆先生(筑波大学),共同研究者で筆者の研究室所属学生の頃より本研究内容に長く従事してくださっている吉田直人先生(名古屋大学),ロボット実装で長く共同研究に携わってくださり本稿にコメント下さった山添大丈先生(兵庫県立大学),HAI研究分野のプロジェクトについてコメントいただいた塩見昌裕室長(ATR深層インタラクション総合研究所)に深くお礼申し上げます.この機会を与えてくださった人工知能学会誌編集委員会に心より感謝申し上げます.