私のブックマーク
擬人化メディアとHuman-Agent Interaction:「情熱」のあるやり取りを目指して
米澤 朋子(関西大学総合情報学部,(株)国際電気通信基礎技術研究所深層インタラクション総合研究所)
目次
1.は じ め に
1・ 1 擬人化メディアとは〈導入〉
Human-Agent Interaction(以下,HAIと表記)という研究分野がここ15 ~ 20 年ほど特に賑わい,AI 研究の発達とともに「人らしい」メディアとして多方面で取り上げられつつある.擬人化システムの構成によるインタラクションデザイン,人間の社会的反応の分析,医療福祉への応用など,多々のトピックが幅広く議論されており,そのどれもが「人」の「人らしきもの」に対する感性ややり取りに関するトピックとなっている.この分野は,ざっくりといえば,Human Robot Interaction の分野を内包しつつ,Human Computer Interaction に内包される分野内の一つでもあり(HCI ⊃ HAI ⊃ HRI),コンピュータや人工物を擬人化することで人工的システムの受容性を高める効果が期待されている.
ここで,擬人化メディアとは,擬人化システムを含む擬人化対象(ぬいぐるみやキャラクタなども含む)により,「対象が,人や動物などのように,物事を感じたりする」と人に思わしめるメディアとする.擬人化システムは,何らかの機能をもつシステムに対し擬人化メディアを付すことで,システムの働きがその擬人化対象により行われていると感じさせるシステム,とする.キャラクタエージェントなど,物理的身体をもたない仮想的な存在を表す擬人化メディアを「仮想エージェント」と呼び,物理的な身体をもっている擬人化メディアを「ロボット/実体エージェント」と呼ぶ.エンジニアリングの視点からは上記の定義で述べていくことになるが,今後の擬人化メディアのさらなる精緻化により,対象を擬人化して捉えさせるメディアというよりむしろ本質的な心をもった存在になっていくと考えられる.
本稿では,擬人化メディア,擬人化システム,エージェント,仮想エージェント,ロボット(実体エージェント)という語を用いるため,混乱防止のために用語をまとめる.1)擬人化メディアは,擬人化を用いた人間への提示をメインとするメディア(システムに付いていないものも含む),2)擬人化システムは,擬人化メディアを付与された何らかの機能をもつシステム,3)エージェントは,擬人化システムのエージェンシーを重視した呼び名,4)仮想エージェントは,ディスプレイやスピーカの中にのみ表現されるエージェント,5)ロボット(実態エージェント)は,物理的身体と動作機構をもつエージェント,をそれぞれ示すこととする.
HAI分野におけるエージェントは,人間という外界とインタラクションをもつ自律システムや自律にみせかけるシステム(書籍 人とロボットの〈間〉をデザインする)とされ,人工知能の分野で扱われる自律的な知的エージェントとは異なり,AI を内包するシステムともいえる.この書籍では,「エージェントの三種の定義」として,ロボット(実体エージェント),仮想エージェント,人間と定義されている.このように,人間も精緻なエージェントであり,人間同士のコミュニケーションもHAI研究の範囲に含まれることがわかる.
1・ 2 擬人化メディアの位置付けと現状〈夢・社会的影響〉
擬人化メディアは,AI の入れ物ともいうことができる.AI が賢いメディアであると思われてきたのに対し,情緒的な機能を有するような仕組みの開発が進む今,擬人化メディアは,これらの機能を内包することで,人間の社会的充足感を与えたり,社会的欲求によって人間の行動変容を実現するメディアとして注目されている.人工的な存在に対し,人間や動物のような頭の働きを実現するには,知覚認知にあたる認識システムや,知的な処理を行う知的システムが必要であると同時に,感情的な処理(c.f. Affective computing)を行うシステムも必要である.さらに,人間や動物は本来生物であり,生理的身体状態と脳の内部の処理は無関係ではなく,相互に作用し合っている.このような生物的身体情動相互作用に関する仮説やその知見も,エージェントやロボット開発に導入されつつある.このような「人や動物を模す」システムは,情報科学をはじめとするさまざまな学問の成果を用いて,さらに精巧に実現されつつある.
一方,擬人化メディアの中は,外観(外見およびその表現)の精巧さが異なるものが多々ある.サービスやシステムに対し,音声のみもしくは簡潔な外観のみをインタフェースとしてシンプルに付すものは,知的サービスを提供する際に使われていることが多い.例えば,SiriやAlexaなどの音声対話サービスは,スマートホームの管理などのシステムにおいてユーザの指示入力をしやすいように導入されている.また,キャラクタエージェントを表示する対話システムは情報提供などのシンプルなシステムにも導入されており,これまでの単純な入出力に対し,シンプルな擬人化メディアによるインタフェースが導入されているといえる.反対に精巧な外観により,ユーザが捉えるシステムに対する「姿勢」を変えてしまう擬人化メディアもある.例えば,ERICAやGeminoid-HI,Geminoid-Fなどのアンドロイドロボットや,ParoやNecoroなどの動物的なペットロボットは,精巧な外見や触感や質感などにより,ふと見た瞬間には「本物」のように感じさせるほどである.
このようなロボットは,知的なサービスにとどまらず,ユーザの心に寄り添う他者の代理(代替他者)として,AI秘書や介護・教育の中など広い応用範囲で期待が寄せられている.実際,さまざまな擬人化メディアの追求により,Orihimeのような自分の身代わりや,いなくなった人の代わり,およびそれ以外の他者の存在を代理させるような,代替他者としてのシステムの実現に手が伸びている状況といっても過言ではない.
一方で,HAIでは,インタラクションを高度化させる研究や擬人化メディアの認知的受容性に関わる考察など,多岐にわたるテーマが内包される.その分野内での体系化も現在は十分なされているとは言いがたく(HAIシンポジウム2021企画セッション「HAIの体系化」),研究者間でもHAIに対する見方は異なると考えられる.よって本稿では,あくまで著者自身の捉えるHAIと,擬人化メディアを用いたシステムに関するまとめを記す.
2.擬 人 化
2・ 1 擬人化の起源と仕組みの理論
そもそもの擬人化は,脅威などに対し畏敬の念を抱いて,対象に意思があると感じたり信じたりしながら生活をしてきたという原始からの宗教の流れにも存在していたといわれている.History of Religion by Paul Kinsellaでは若干風刺的な人間の信仰対象の変遷を表している.科学的には意思をもった存在ではないはずの対象に意思を見いだす原始の人間の感じ方は擬人化の第一歩といえる(人とロボットの〈間〉をデザインする).一方で,子供が太陽や花などに顔を書いたり生きているというように,意思をつかめない対象を擬人化し意思を想定する行為であるともいえる.
また,原始時代の土偶のように,形をもったものをつくることでその対象を擬人化するという,設計者による擬人化対象の制作が行われてきた.現在でも,亡くなった人の代理となる位牌や遺影など,現実に存在していた人を投影する対象としてのメディアもある.ロボットの設計においてロボットを人らしく捉えてもらうよう設計者が工夫し,擬人化して用いてもらうものもあるが,掃除機ロボットルンバのように,機能を優先して設計された対象にも,人間はときに心や意思を感じるという.
2・ 2 志 向 姿 勢
このような人間の擬人化感受性機能に関して,哲学者・認知科学者・生物学者のダニエル・デネットは書籍「志向姿勢の哲学」において,人間が対象を見るときの見方・感じ方には,物理的現象によって動作するのみの対象であるという物理姿勢,設計されたとおりに動く対象であるという設計姿勢,意思をもって行動しようとする対象であるという志向姿勢があるとしている.例えば,原始的動物や植物が,生物的システムが設計されたとおりに動いているだけと見るのか(設計姿勢),意思をもって生きようとしていると見るのか(志向姿勢)によって,擬人化が解釈者の中に起きているのかどうかが分かれる.
志向姿勢に関する追加文献
- 書籍「志向姿勢の哲学」 / Intentional_stance
- Book: Intentional Behaviorism
- Dennett の哲学的論考が指摘する3 つのスタンスの存在の検証
- The intentional stance toward robots: Conceptual and methodological considerations
- An intentional stance modulates the integration of gesture and speech during comprehension
- Imaging the intentional stance in a competitive game
- 赤ちゃん・こどもの志向姿勢
人工のメディアに対する人間の志向姿勢ともいえるメディアの等式(Media Equation,Book: The MediaEquationでは,メディアに表現される・起きていることを現実だと感じる人間の特性を示している.HAIにおけるメディアイクエージョンで触れられているように,HAIにおける志向姿勢は,チューリングテストのように人工物が人間かのように思い込ませる外観やインタラクションを提供するか否かにかかっているといえる.
2・ 3 アニマシー知覚と不気味の谷
ここで,志向姿勢における意思をもった対象として,「人間」から「生き物」に広げる.対象に生き物だという感覚をもつことを,アニマシー知覚という.動物的な志向姿勢を見いだす知覚ということもできるだろう.この感覚についてはHeider and Simmel が行ったAn experimental study of apparent behaviorにおいて示された,本当の生き物(動物)ではない対象に対する志向姿勢ということもできる.ビデオ「Heider and Simmel Movie」を見ると三角や丸といった単純な形状が棒線の周りで動することがくだけのムービーに,志向姿勢をもった対象を見い出し,その意図を推定実感できる.
このような人間(や他の動物など)の知覚は,外敵かどうかなど瞬時の判断を求められる脳の機能と考えられる一方,意思をもっている(擬人化して捉えるべき)対象かそうでない対象かの間で揺れ動くことで混乱することもある.これに関係し,不気味の谷現象では,人間に類似してくるほど好感をもたらしつつもある段階から急激に気持ち悪さを感じるということが起こるとされる.この気持ち悪さが何によって引き起こされるかの議論では,連続的状態からカテゴリー知覚的(顔の表情や声などさまざまな刺激から人間が状態を分離的に知覚する現象)に扱う難しさに起因するという説もある(Categorization difficulty is associated with negative evaluation in the “uncanny valley” phenomenon,Categorical Perception).つまり,人工物が人間に似てくるときに起こる不気味の谷では,志向姿勢と設計姿勢の間でカテゴリー知覚的に揺れ動くと考えられる.
一方このような気持ち悪さやネガティブ感情は,予想を下回る実際の内部機能によっても引き起こされると考えられる.この差を適応ギャップ(How Does the Difference Between Users’ Expectations and Perceptions About a Robotic Agent Affect Their Behavior?)といい,予想する機能より実際の機能が上回るほうが不快感を下げられる.もちろん実際の機能に対する知覚は急激に起こるものではなく,エージェントとユーザの二者間で相互適応というインタラクションを通じた再帰的な対象理解が前提である.
アニマシー知覚に関する追加文献
- アニマシー知覚:人工物から感じられる生物らしさ(注目度の高い記事@ ロボット学会誌)
- 実際の生物を用いたアニマシー知覚の脳内基盤の検討
- Social connection modulates perceptions of animacy
- Emotion expression modulates perception of animacy from faces
- Perception of animacy in dogs and humans
- Child animism: What the child means by “Alive”
不気味の谷に関する追加文献
- Uncanny valley from the field
- The uncanny valley: The original essay by Masahiro Mori
- Does the uncanny valley exist? An empirical test of the relationship between eeriness and the human likeness of digitally created faces
- Measuring the uncanny valley effect
- Feeling robots and human zombies: Mind perception and the uncanny valley
- Avoiding the uncanny valley: Robot appearance, personality and consistency of behavior in an attentionseeking home scenario for a robot companion
カテゴリー知覚(Categorical perception)に関する追加文献
- Categorical perception of facial expressions
- On the nature of categorical perception of speech sounds
- A reappraisal of the uncanny valley: categorical perception or frequency-based sensitization?
- Categorization difficulty is associated with negative evaluation in the “uncanny valley” phenomenon
相互適応(Mutual adaptation, co-adaptation)/ 適応ギャップ(Adaptation gap)に関する追加文献
- 人間とエージェントの相互適応と適応ギャップ
- How does the difference between users’ expectations and perceptions about a robotic agent affect their behavior?
- Human-agent co-adaptation using error-related potentials
2・ 4 心の知覚と身体(生理)
人間がもっている心の知覚として,計算したり理解するなどの知能としての冷たい(賢い)心,および他者との関わりや自身の感情などの温かい心(情動),の2 軸があると考えられている.Semantic differential scale method can reveal multi-dimensionalaspects of mind perceptionでは,SD 法による因子分析によりEmotion 軸とIntelligence 軸の知覚が示され,これは心の感じ方に関する先行研究Dimension of mind perceptionにおけるExperience 軸とAgency 軸(図1)を肯定すると言える.
このようにagency / intelligence とexperience / emotion の値はさまざまなエージェントにより異なると考えられており,適応ギャップはそれぞれの軸に対して存在していると考えると,弱いロボットはこの中のexperience / emotion 軸において正の適応ギャップ(期待以上)となりつつagency /intelligence 軸において負の適応ギャップがあるともいえる(なお,弱いロボットは,HCI 分野では不便益や仕掛学(書籍「仕掛学─人を動かすアイデアのつくり方」)などにおける人間の行動変容デザインにも関連する).
実際にはこの2 軸が完全に独立かどうかは不明である.例えば,ソマティックマーカー仮説,[ The somatic marker hypothesis and the possible functions of the prefrontal cortex]では,人間は本来生物であり,生理的身体状態と脳の内部の処理は無関係ではなく,相互に作用し合っているとしている.本能的な心は知能・理性の対極として捉えられるが,身体との相互作用のある心がexperience / emotion にあたり,独立的な知性の心がagency / intelligence と考えることもできる.ソマティックマーカー仮説は,情動だけでなく,意思決定をする知能・理性にも身体状態(およびそれと相互作用のある情動)が影響するという考えだといえる.
一方,著者らはこのような身体と切り離せない心をもつかのように振る舞うエージェントデザインとして,呼吸や心拍,鳥肌といった,本能に基づく生理的な現象を表すロボティクスに取り組んでいる.
弱いロボットに関する追加文献
ソマティックマーカー仮説に関する追加文献
- The somatic marker hypothesis and the possible functions of the prefrontal cortex
- The somatic marker hypothesis: A neural theory of economic decision
- Emotion and consciousness
- 身体状態の「意味づけ」としての情動
2・ 5 共感と擬人化
人間が他者に共感するとき,ミラーニューロン(他者の行動を見たときと自分の行動の両方で反応する脳の賦活)の働きが作用しているとされる[The ‘shared manifold’ hypothesis. From mirror neurons to empathy].一方,情動伝染(Emotional contagion)は他者の情動を見ることが自分の情動に影響するという現象で,行動や状況に応じて間接的に共感するのとは異なり,より直接的に共感している状況ともいえる.他者の情動が視覚的には顔表情,聴覚的には音声韻律から読み取られ,情動伝染が起こりその情動が表出されることで表情模倣が起こる.表情模倣を利用してユーザの心的状況を変化させる扇情的な鏡は自身の顔画像をベースとしているため,他者に対する共感とは異なるが,エージェントの情動伝染効果を示すものといえる.
情動伝染や表情模倣に関する追加文献
- 情動伝染の個人特性と脳内ミラーシステム活動特性の関連
- The emotional contagion scale
- From facial mimicry to emotional empathy
- ミラーニューロンシステムが結ぶ身体性と社会性
- Covert digital manipulation of vocal emotion alter speakers’ emotional states in a congruent direction(音声でも)
- DAVID: An open-source platform for real-time transformation of infra-segmental emotional cues in running speech
3.擬人化システムの構成
擬人化システムは,冒頭で述べたとおり,擬人化メディアを付与された何らかの機能をもつシステムで,エージェンシー:ユーザに対しエージェントを想起させユーザの社会的反応を誘発するシステムの振舞い(ヒューマンエージェントインタラクションから見る人工物・人工システムのエージェンシー)を有効活用し,ユーザの受容性(Design for acceptability: improving robots’ coexistence in human society)や理解度を高めていくことが望ましい.
つまり,擬人化システムをつくる際は,ユーザに社会的反応を誘発させるための仕組みとして,あらゆる「人らしい」機構が備わっていることが必要であり,「人工のヒト」をつくると言っても過言ではない.そのためここでは,HAI研究における擬人化システムの開発を大きく分けて,身体性・知能(知覚認知システム,内部状態,社会性)の視点から,代替他者を果たしていくために考慮すべきデザインのポイントや,これまでの研究例を取り上げる.偏りはあるかもしれないが,筆者の考える擬人化システムのデザインでは下記のように分類する.
- 架空の存在の外観をデザインすること:身体性のデザイン
- 髪型・顔・体型などの外見
- 動き方,視線,声などの振舞い(表現)
- 架空の存在の機能をデザインすること:対話性・自律性のデザイン
- 知覚,認知などの認識
- 性格,興味,理解度,考え方などの知能
- 人間関係やその関係性形成などの社会性
- デザインに伴うセンサ系・アクチュエータ系の設計
- 上記が実現する感受性(センサ系)と,その表現を行う駆動システム(アクチュエータ系)
HAI 研究における基礎的な擬人化システムに関する追加文献
- 人工知能はどのように擬人化されるべきなのか?
- 書籍「マインドインタラクション AI 学者が考える≪ココロ≫のエージェント」
- 書籍「インタラクションの認知科学」
- Anthropomorphism and the social robot
- Anthropomorphism in human–robot co-evolution
- Anthropomorphism: opportunities and challenges in human–robot interaction
- Designing robots with movement in mind
- Human-agent and human-robot interaction theory: Similarities to and differences from human-human interaction
3・ 1 身体性としての外観(表出機構)
ロボットは実体をもち我々と同じ空間に存在している.一方仮想エージェントはディスプレイなどを通して垣間見えるバーチャルな世界に存在している.このようなエージェントたちには,身体性,(Embodiment)がある.身体性により,ユーザが志向姿勢でエージェントを捉え,社会的反応を引き起こしやすくなる.また一方で身体性の中でも物理的身体性をもつことは,外界の理解や物理的接触を可能とする.特にHAI研究で扱う身体性は,視覚的・聴覚的・物理的な具現化によりエージェント自身の意図や意思に伴った行動を示し,ユーザの社会的反応を引き起こす.冒頭で述べた用語の定義としては身体性=擬人化メディアであり,人間とのインタフェースを司る.つまり,後述する機能(知覚認知システム,内部状態,社会性)への入力と出力(表出)を担う器官となる,擬人化システムの要である.
身体性のないエージェントとしてELIZAなどテキスト対話エージェントも存在するが,音声対話エージェントは声の特徴により老若男女のキャラクタを聴覚的に具現化することでその身体の存在と心や内部機構の存在を想定させる.また,視覚的な身体性をもつ仮想エージェントおよびロボットは,外見と振舞いが具現化されることにより身体を伴う表現をすることが可能であり,老若男女に限らずさまざまなキャラクタの外見を表示したり,人間が視覚的に提示するような顔表情や身体動作を実現できる.中でもロボットは,物理的な身体性をもつことでその存在性を強めたり接触などの物理的インタラクションを可能とする.
上記のようにエージェントの身体性には複数の要素があるが,実在ロボット・遠隔で表示されるロボット・仮想エージェントを比較した研究では,実在ロボットと遠隔で表示されるロボットの間では存在性(presence)が異なり,遠隔で表示されるロボットと仮想エージェントの間では物理的身体性(physicalembodiment)が異なるとしている.
聴視覚的身体性をもつエージェントは,表情やジェスチャなどさまざまなモダリティを活用して表現を行うことができる(マルチモーダル表現・マルチモーダルインタフェース).また複数のモダリティの組合せによる相互作用(クロスモーダル表現)によりさまざまな効果を狙うこともできる.
前述の適応ギャップで述べたとおり,外観の精巧さと擬人化システムに求める機能には相関があるとも言えるが,必ずしもこの外観が精巧であればよい訳ではない.ロボットデザイナ(ex. 園山隆輔─書籍「ロボットデザイン概論」─,松井龍哉 etc.)は,さまざまなロボットの実用シーンにおけるニーズを把握しながらその身体性をデザインする職業の方達である.ロボットや仮想エージェントの設計では,外見(Appearance)と振舞いとしての動作(Expressive motions)は切っても切り離せない関係であるため,それらの振舞いを考慮しながら技術的設計者とデザイナがその外観をデザインしていく.
ロボットの身体性に関する追加文献
- The benefit of being physically present:A survey of experimental works comparing co-present robots, telepresent robots and virtual agents
- Embodiment in socially interactive robots
- The effects of overall robot shape on the emotions invoked in users and the perceived personalities of robot
- Blurring human–machine distinctions:Anthropomorphic appearance in social robots as a threat to human distinctiveness
- クロスモーダル知覚を応用した情動インタフェース
- エージェントの外見の違いがユーザの態度解釈に与える影響
人間や動物に似せた顔をもつエージェントにはその視線や顔表情による感情表出表現がある.仮想エージェントでは3D または2D 表現によりこれらを構成することができるためロボットに比べ容易であるが,ロボットではkismetやiCat: an animated user-interface robot with personalityのように顔の上のパーツを物理的に制御するものやMaskbotやLOVOTのように顔表情や目の表現のみディスプレイに頼るもの,瞳孔表現をするものもあり,リアリティとコストが比例する中で研究目的に応じてミニマルデザインされる傾向がある.
ロボットの物理的身体性には,空間共有状況下でMeet me where I’m gazing: How shared attention gaze affects human-robot handover timingなど指さしやMeet me where I’m gazing: How shared attention gaze affects human-robot handover timingなど視線による空間情報を伴ったインタラクションを実現することができる(リアルなロボットの視線]).仮想エージェントには一般的には不可能だが,一部エージェントユーザ視点位置に応じた描画エージェントを用いた実空間内注視コミュニケーションの検証ではVR と裸眼立体視を用いた擬似3D 空間を現実空間の座標系に接続することで空間共有インタラクションの実現を狙っている.一方,仮想エージェントには物理的な接触が不可能である.ロボットにおける接触を伴うHAI研究として,The hug: An exploration ofrobotic form for intimate communicationなどソーシャルタッチに関する研究が広がりつつある(ソーシャルタッチの研究プロジェクト).人間に似せた触感のシリコン皮膚をもつアンドロイドにも将来的にこのような機能が搭載される可能性もあるが,どのような表現や振舞いがユーザにどのように解釈されるかについての議論がまだ必要な段階である.感情的な動きの再現Geppetto: Enabling semantic design of expressive robot behaviorsではロボットの動きと文脈を結び付けて学習した結果の動き自動生成が提案されている.
一方,振舞いの中に含まれる聴覚的身体性としての音声表現がある.感情音声(感情音声合成,音声からの感情の認識)や個人性音声合成・認識 などさまざまな研究によりText-to-speech からよりパラ言語要素の含まれたリッチな音声表現が実現しつつある.歌声合成(歌声合成とその応用)を用いたバーチャルアイドル初音ミクなどは表現力をユーザの創造性に寄与させる製品としてもリリースされている.ここではさまざまなパラ言語要素(イントネーションプロソディなど)や言語的表現についてはそれぞれ音声研究や言語研究の分野で詳しく扱われているため割愛する.
指差し・表情・視線・目の表現に関する追加文献
- Humanlike conversation with gestures and verbal cues based on a three-layer attention-drawing model
- Effects of nonverbal communication on efficiency and robustness in human-robot teamwork
- Sociable machines: Expressive social exchange between humans and robots
- Attractive, informative, and communicative robot system on guide plate as an attendant with awareness of user’s gaze
身体接触表現に関する追加文献
- Softness, warmth, and responsiveness improve robot hugs
- Effect of robot’s active touch on people’s motivation
- A robot that encourages self-disclosure by hug
- Physical contact using haptic and gestural expressions for ubiquitous partner robot
- HugBot: A soft robot designed to give human-like hugs
- Survey of social touch interaction between humans and robots
- Social touch in human–computer interaction
- How do communication cues change impressions of human–robot touch interaction?
- Empathic Touch by Relational Agents
3・ 2 知能(内部・AI デザイン)
人間がもっている情報処理機構はAI技術の中で語られるため,ここでは人間らしい情報処理のための基礎的構造に簡潔に触れるのみとする.
§ 1 外部センシング(知覚認知システム)
人間を含む動物はさまざまな感覚器でリアルタイムに外的状況を獲得する.視覚情報,聴覚情報を処理する機能に関する画像処理技術,音声処理技術は深層学習技術でさらに発展しつつある.ロボット聴覚など,エージェントの状況に応じた信号処理技術に関する分野も発展している.
一方,触覚センシングは筆者がAnalyses of textile pressure-map sensor data of a stuffed toy for understanding human emotional physical contactで処理技術を検討したが,視聴覚に比べ研究例や技術の充実は弱い.Topography of social touching depends on emotional bonds between humansのように人間の間で行われる接触に関する分析をベースに今後発展していくと考えられる.
外界理解においては,要素を認識していくことだけでなく,上位レベルとしてさまざまな社会的状況理解や他者の心理的状況理解までを実現することが,共感や社会的行動につながる重要な認知機構となると考えられる.
§ 2 内部状態
人間に起こる内部状態や内部処理の機構に関し,特にHAIにおいては他者との関係に関わる知能に焦点が当てられている.人間は認識により得られた外部状態が自らに良い状況かに応じ,身体に直結した本能的情動や感情が起こる.例えば他者からの情動伝染は他者とのインタラクションを通じた感情理解による内部状態の変化である.Russell が提唱した感情円環モデルではこの感情状態をpleasure 軸(快不快)とarousal 軸(覚醒度)の2 軸において連続的に表すことができる.一方Ekman は感情を不連続なカテゴリーに分けて扱った.
エージェントをデザインし実装する際に,このいずれのモデルに基づくかにより性格特性のデザイン手法も異なる.例えばEkmanの不連続なカテゴリーをベースとして,マルコフ過程の状態遷移を用いた遷移確率の調整を行うことで,悲しみやすい性格や喜びやすい性格などの性格特徴を再現できる.Russell の連続性のあるモデルであれば,パラメータの比重をキャラクタごとに変更するなどにより実現するだろう.また,理性的な性格は,内部の感情状態が判断を鈍らせない程度の勾配で変化するにとどまったりリミッターがある状態をつくればよいと考えられる.
次に,何らかの判断をしたり実行に移すなどの行動を引き起こす欲求として,内発的動機と外発的動機が必要である.外発的動機は外部の状況により行動が引き起こされるが,内発的動機はエージェント自身がもつ動機とされる.このような動機をもつことで「ほしいけれど我慢」といったさまざまな内部状態をもつエージェントが実現可能になる.
感情に関する追加文献
- A circumplex model of affect
- An argument for basic emotions
- 感性ロボットのための感情領域を用いた表情生成
- ニューラルネットワークを用いたMaC モデルに基づく感情生成システム
- Emotion representation, analysis and synthesis in continuous space: A survey
内発的動機に関する追加文献
- 内発的動機付けによるエージェントの学習と発達
- Intrinsic Motivation Systems for Autonomous Mental Development
- A motivation model for interaction between parent and child based on the need for relatedness
自然言語処理分野における対話システム研究はAI 研究の一端として広がりを見せているが,特に他者とのつながりを重視した雑談などの対話は,目的や正解のみがある情報提供型対話とは異なり,HAI研究に関係するゴールをもっている.対話知能学はこれらの知能を統合したインタラクティブなエージェントの高度化を目指すプロジェクトといえる.
§ 3 社会性
エージェントの社会性は,人間ユーザである他者を理解する機能,および自らの立ち位置を決定したり変化させたりする機能ともいえる.例えば,教室や雑談などの会話の中でどのように参加しているかという立場(参与構造多人数会話における参与構造分析, Participating with limited communication means: Conversation analytical perspectives on the interactional management of participation structures)やその立場に応じた適切な表現・発言に関わる話者交替・発話交替など,他者とのコミュニケーションを行う際の発言に関わる立ち位置は三人以上のコミュニケーションにおいて非常に重要である.
一方,コミュニケーションを行う際の重要な文脈の一つとして,社会的関係性がある.複数の人間が対話を行う前提として相手の存在をテンポラリに位置付けるのが上記の参与構造であるならば,バランス理論は,長期的関係性と,他者と他者の関係性が及ぼす影響に関わる,他者の長期的位置付けといえるだろう.バランス理論では,単純化した一対一の関係性が複数存在する三人以上の関係において,図3 のようなそれぞれの間柄における複数の関係性がUnbalancedな状態にあると,Balancedな状態を目指して関係性が変化しやすいことを表している.
ソシオン理論に基づいたクラス内のいじめと同調方略のモデル化などの研究では,ソシオン理論とこのバランス理論を用いた人間関係の変遷のモデル化を検討している.ソシオン理論は1990 年の関西大学社会学部紀要において発表された.ニューラルネットワークにおける素子がニューロンであることからソーシャルネットワークの素子をソシオンと名付け,社会の中の参加者それぞれに対人関係のモデルが存在している.
長期的に変動する人間関係や,各個人がもつプロパティに応じて,これらのモデルにも影響があると考えられ,エージェントが人間以上に人間関係を理解したり,弱い立場にあえてなっておくことで人間社会を円滑にするなど,さらなる研究の発展が望まれる.
バランス理論に関する追加文献
- Book: Emergence of Social Balance in Signed Network(Springer)
- Some dynamics of social balance processes:bringing Heider back into balance theory
- Explaining social contagion in sport applying Heider’s balance theory:First experimental results
ソシオン理論に関する追加文献
- 書籍「ソシオン理論入門」
- 学級内SNSを導入したソシオン理論に基づく学級集団形成モデル
- Simulation of bullying and conforming in a class based on socion theory
3・ 3 フィールド応用と発展,製品
HAI研究をさまざまなフィールドで応用するシーンが増えてきている.一方で新たな応用の可能性は,当然ながらシーンとターゲットユーザの選定を行ったうえで検討される.HAI研究分野でよく取り扱われるフィールドとしては,教育(教室環境,幼児,障がい),介護支援(施設,自宅),商用施設(スーパー,ショッピングモールなど),家庭内,などがあげられる.教室環境では,人間の社会関係の分析とそれに応じたエージェントの振舞いによる人間関係の改善や個々の支援,商用施設では,ディジタルサイネージにおける情報提供にあたる機能やさりげない買い物支援など店員の代替,など,人間の社会に入り込むHAI研究の応用が望まれる.その一方,介護シーンでは,高齢認知症患者の社会的ひきこもりに対するコミュニケーションの機会の創生,家庭内では,孤独の解消や娯楽,など,個人ユーザに向けたパーソナライズドなサービス,医療・トレーニングなどの福祉分野では,医療者やトレーナを代替するエージェントが求められる.
家庭内個人向けの擬人化システムは長い間取り組まれてきた(Aibo etc.)結果として,製品化されたものが多い.ぬいぐるみに対話機能を付与するPechatやQoobo,LOVOTなどの愛玩系ロボットは近年リリースされた愛着をもたせるデザインの家庭用ロボットシステムである.個人の利用シーンに応じた価格帯と外界理解や内部処理のレベルは,今後もさらなるバリエーションをもって多数の製品がリリースされると考えられる.その一方,医療福祉分野で現在リリースされている製品は,物理的な歩行トレーニング支援や介護支援といった作業支援ロボットが目立つ状況となっており,個人用のロボットにおけるHAIの浸透状況とは異なる.このような現状を踏まえ,各フィールドにおいて必要なHAI技術の実用が急がれる.
4.HAIにおける状況
4・ 1 他分野との相互作用,およびHAI研究の体系化の難しさ
上記のように認知科学や心理学,神経科学,脳科学,言語学などの分野から得られた知見や理論や仮説を,人工知能(情報科学)をベースにしつつ擬人化システムに組み込んで,工学的に擬人化システムを改良したり,構成論的に検証するなど,HAIは多くの分野にまたがる研究分野である.また,発達心理学・神経科学・医学などとも関係があり(計算論的神経科学,計算論的精神医学研究室),エージェントの心を構成したり人間の心の仕組みを取り入れたりするなどの点で他分野との相互作用が大きい.HAIにおける外観や身体のデザインや製品化においてはロボット工学,美学,デザイン学も関係しており,応用シーンとしても医学,看護学,教育学,介護福祉学,経済学など,複数の分野に波及効果がある.
HAIの基礎に関連するトピックを取り上げると,擬人化という心理的状態の分析解明が多く取り扱われることとなり,実際,HAI分野の研究においては認知科学者の占める割合は大きいが,今後はHAIからのアウトプットに関連する他分野におけるHAIの取組みが増えることが期待される.
このようなHAI研究のトピックを鑑みると,他分野に広がるテーマであるがゆえに,HAI研究という学問を体系化する難しさに対面する.HAIシンポジウム2021 企画セッション「HAIの体系化」では,研究者ごとに体系化への提言が異なっており,HAI学という学問を考えるときの像が不確定さを維持しているといえる.立場の違いによりHAI研究の追求ポイントも異なる.例えば,人間の心の仕組みや反応にさほど根ざさない,システムとしての提案も多々あるが,HAIにおける学術的な議論は最終的に認知科学や心理学的側面なしには語ることができない.するとシステムとしての議論をする土壌が少なく,工学的な議論を他のコミュニティに任せてしまう側面もある.一方で,構成論的立場やデザイン学的立場などさまざまな研究者が集うため,相互に刺激を受け新しい研究テーマが立ち上がるなど,学際的領域ならではの創造性にも満ちている.
一つ一つの研究のオリジナリティの在り方は議論の余地が多いが,HAI研究におけるオリジナリティやヒューマンエージェントインタラクションの研究動向も参考にされたい.
4・ 2 HAIにおける課題~ロボット・仮想エージェント,および人間の解明と発達~
HAIでは,擬人化メディアとのやり取りにおいて人間ユーザが感じるさまざまな課題や,擬人化メディアの改善に向けた人間と人間のコミュニケーションの仕組み自体の研究など,広く扱われている.擬人化メディアを用いたインタラクションデザインとしてのHAIには多くの課題がある.擬人化メディアを構成するうえでの課題や対話性能や認識性能といった知的な問題解決とは別に,インタフェースの観点や実用の観点から下記があげられる.
§ 1 インタフェースとしての必然性
玩具菓子(食玩)におけるおまけのおもちゃと菓子の関係では,菓子自体を楽しむためのツールとしておもちゃが存在しているとは限らない.同様に,システムにとってユーザインタフェースとして擬人化メディアが必然性をもっているとは限らない.初音ミクやユニティちゃんのようなバーチャルアイドルの擬人化メディアが,歌声合成や3D ゲーム開発へのモチベーションを高め,ユーザ人口を増やすことに貢献するのも一つの効果として認められている.擬人化メディアの適用にはこのような効果が期待されていることも,今後さらにHAI技術が求められることを示しているといえる.
一方で,音声対話システムに対しビジュアルの外観を付与することで,対面対話エージェント(Galatea システム)にして対話性を高めるなど,擬人化メディアの必然性が高いシステムがある.これは,システム自体を利用する際,対象に人格があると思いながらやり取りするほうがスムースな場合である.特に,ユーザの心に寄り添ったり,対話的にサービス提供するようなシーンを想定すると,操作的に扱うのではなく,擬人化して扱うほうが望ましい.HAIでは,この親和性をできるだけ利用し,ミスマッチを防ぎながらシステムを構成していくことが求められる.
§ 2 受容性に向けた自然さや精巧さ
自然であることは,人間がシステムを受け入れる(Acceptability)ための一つの重要なファクタとなる.そのために,さまざまな擬人化メディアを精巧にしたり,精巧さには一方で不気味の谷(Uncanny valley effect)問題がある(Wired の不気味の谷を検証するロボット).これは,できるだけ自然に本物に近づけようとして人間に似せていくと,本物に近いポイントで気味が悪いという感覚を引き起こすという説である.前述のとおり,この現象を説明する説としてカテゴリー知覚的に引き起こされるという説もあり(Burleigh らによる「A reappraisal of the uncannyvalley: Categorical perception or frequency-based sensitization?」),知覚認知の機構と擬人化が大きく関わることを示す.受容性に向けた自然さやリアリティおよびデフォルメは,ユーザ特性や相性を鑑みながら,外見だけでなく振舞いや性格にも求められていくと考えられる.
§ 3 人間や動物自体,およびそれらのインタラクションの仕組み解明
前述の自然さや精巧さを細緻に実現する中で,HAIの設計において,擬人化システムが外界をどのように認知・情報処理するべきかという課題に対する一つのアプローチとして,人間や動物が実際にどのように他者とのインタラクションを実現しているかを解明する研究課題もある.例えば,工学的に問題解決する新規のアルゴリズムを考案することと並行し,ヒューリスティクス的に人間が行う情報処理を再現することで,それらの強みを鑑みたシステムがつくられるように,HAIの研究課題の中には「人間自体を対象とした」研究も多く含まれる.
その中にはゲームのルール内においてどのように人間が反応・行動するかを細緻に調査する研究がある.例えば,書籍「人狼知能:だます・見破る・説得する人工知能」のように,人間との騙し合いにおいて,心があるふりをする人工知能が人間にどのように捉えられるかを検証する研究や,人間とエージェントの発話交替(Turn-taking)の態度表示による発話交代シミュレーションゲームなど,マルチモーダルな表示による人間の社会的反応の解明を目指す研究もある.
§ 4 人間と擬人化メディアの立場のギャップ
人間に対し擬人化メディアを用いたシステム,その存在(エージェント)の社会的な立場をどのように設定するかという課題がある.例えばマネージャエージェントであれば対等より発言力を強めることになるし,秘書エージェントはユーザの支援をする立場で,ユーザがよほどの規範逸脱を犯さない限りは支援し続けることになる.営業エージェントであれば客先における姿勢は丁寧でなければならない一方で,自己開示姿勢によるユーザの軟化を求めることも必要となる.この問題はグループエージェントを扱う際により複雑になる.また,複数ユーザに対応する際はそのユーザ感の関係性理解が重要となる.
また,下記の倫理的課題にも関係するが,映画AIに出てくるような,立場の乗取り問題を危惧する視点もある.これは,擬人化システムに自律性や自己愛,社会性などを備えていった結果として,人間に大切に扱われていないなどによる不快さが元となって,人類全体に対する対抗心が生まれてしまうケースを予想したものと考えられる.
§ 5 倫理的課題
受容性の向上に向けて,仮想エージェントやロボットのインタラクションデザインを精巧にするなどにより,擬人化メディアが心の拠り所であるパートナになることで,人間の信頼を得ていくことになる.すると,そのメディア自体をデザインできてしまうことによる危うさが発生する.ロボット倫理学wiki(参考:ロボット倫理学の現在)は,ロボットにおけるこのような危うさを取り扱う分野の研究で,ロボット三原則(参考:ロボット三原則+ AI 七原則)から広がり発展していく擬人化メディアの設計指針に,重要な指南を与える分野となっている.
擬人化メディアには,ロボットに限らず,ユーザが心の存在を信じてしまう危うさがある一方,ロボットは物理的身体により物理的危険をもたらすリスクがある.これらを鑑みて下記のような課題に対し包括的にHAI倫理学が構成されていくことが望ましい.実際,それぞれの課題に対し,人工知能を含むテクノロジーの進化に対応しながら哲学,心理学,工学などさまざまな分野から検討されてきている.
- 架空と実際の違い:架空の出来事を演出できてしまう仮想エージェントによる,ユーザの現実認識のずれにどのように対応するか.
- ロボットなどの人格っぽいものをもったものの行動規範と制限:ユーザに対して不快感や危険を与えないなどの行動規範はいかにあるべきか.
- 責任の所在:誰がその指示を出したのか? エージェント自身なのか,設計者なのか,ユーザとのインタラクションの中で決定したことか.
- エージェント自体の権利(人権? ロボット権?):その擬人化システムが不快に思ったり危険を感じたりするような状況は人工物だから許容されるべきなのか.人間ユーザから見ても不快なことなのではないか.
エージェントが他者を思いやる規範をもち振る舞うことと,エージェント自身の自由や多様性の保障は,人間が法律,社会などにおいてそうであるようにトレードオフでもある.よって,今後のロボットや仮想エージェントを含む擬人化システムでは,システム自身が「意識」していくべき規範や倫理を,現状の周辺環境や社会情勢に応じて流動的に解釈しつつ,逸脱行為を避ける仕組みが必要である.
文献としては「ロボットからの倫理学入門」などがわかりやすいと思われる.
§ 6 応用フィールドにおける課題
HAIを適用した応用はさまざまなフィールドで行われている.教育・介護・看護・トレーニングなど,エージェントからのさまざまな働きかけがユーザに「相手の心」を感じさせ,行動変容をもたらすことを狙っている.これらに共通していえるのは,HAI技術によって,誰がどのように助けられるか,という明確な目的・ビジョンが必要である点である.そして,他者の存在が必要なのに存在できない・しにくいシーンを選定し,人材不足を解消することになる.しかし,ユーザの個人性はさまざまで,求めるエージェントの性質は異なるため,応用製品などを画一的デザインでリリースすることは望まれない.また,周辺の環境やユーザの社会状況を鑑みた包括的最適解デザインのエージェントが,最も受容性を高めるといえる.このような多目的最適化のような取組みはいまだ多くないため,市場へのHAI技術の浸透に向けて取り組まれたいテーマの一つとも考えられる.
また,介護施設や商用施設などプライバシーの問題を抱えるフィールドにおける研究の実施はそれ自体が難しく,取得データのプライバシー考慮における制限やデータ処理の必要性,および特殊で自動認識の難しいデータにはラベリングの必要がある.エージェントの導入に対する受容性の問題から対照実験を行うのも倫理的課題として容易ではない.よって,HAI研究自体への世の中の受容性を高めながらフィールド実証実験と商品化などの実用を両輪で進めることが必要不可欠であると考えられる.
5.HAIに関連する学術コミュニティ
5・ 1 会議系
HAIに関連する国際会議や国内会議のコミュニティが存在している.最たるものが下記のHAIとHAIシンポジウムといえる.しかし多岐にわたる分野に関連しながら発展しているコミュニティであるため,いくつかのコミュニティとその特徴などを述べる.
- HAI:Human-Agent Interaction のコミュニティは,国内のHAIシンポジウムを発端にエージェント関係の会議の中ではトップカンファレンスに連なる重要国際会議となった.2013 年から開始され,2021年には9回目となる今年,Covid-19 により昨年に引き続きオンライン開催となるか3月末時点では未定であるが,日本国内,名古屋での開催が予定されている.採択率は40%以下で,参加国も年々広がっており,国内でのHAIシンポジウムと連動しながらも,HRIコミュニティや心理学・神経科学など多岐にわたる研究者が参加し,多様なワークショップも併催されている.ACM系.本稿はこのコミュニティをメインとする著者が執筆しているため,下記のリンクは参考までに付けているが,どれも重要で関連深いといえる.
- HAIシンポジウム:上記のとおり,HAIの国際会議と深くリンクする国内シンポジウム.2006年から開催され2021年で15回目の開催(HAIシンポジウムの過去開催分までのリンクのあるプロシーディングス).
- HRI:Human Robot Interaction は,2006 年からACM の国際会議として開始している.HAIと類似分野でありつつ毛色が違うのは,ロボットが実世界に身体をもつエージェントであるがゆえの,制御動作に応じた空間を介したインタラクションや,実世界の我々の生活を物理的に支援するシステムなど,新規の実世界インタラクションに踏み込む研究や,それらが人間の認知や解釈に与える影響に関する検証が多く含まれる点である.
- CHI:言わずと知れたACM SIGCHI.1982年から開催されている老舗会議で超難関.デバイス構成からインタラクション分析まで広く取り扱うため,参考研究を見つけるには良い.また,HAI分野からの投稿・採録もある.
- ICMI:Multimodal Interfaceの難関国際会議.2021年で23回目になる.マルチモーダル情報による人間の状態認識がメインであったが,近年はエージェントやロボティクスに関する投稿もある.
- その他ロボット系
- Agent 系:IVA:ACM.2007年から開催,21回目.2005年までは隔年開催だった.Second Lifeなど仮想世界でのやり取りを多く扱ってきている.
- IEEE VR:IEEE.1993年にシンポジウムとして開始したのち,1999年から国際会議になっている.仮想エージェント関連でVR に関する国際会議にも複数目を引く研究がある.ほかにもVR 系国際会議は接触に絞ったものなど多岐にわたるが,ここでは省略する.
- その他
- ジャーナル(本稿の論文リンク先ジャーナルなど下記のほか多数)
5・ 2 その他国内会議や研究会などローカル系
上記のほかにも国内の会議や研究会などのコミュニティがある.HAIにのみフォーカスを当てる研究会は存在していないが,多岐にわたる分野が関わっていることを一部のリンクにより示す.これら以外にも関連するコミュニティがあるため,追記や編集をしていくべき箇所といえる.
(基):基礎的なHAI 構成に関わる,(応):応用フィールド,(展):発展および転回的フィールド
- HAIシンポジウム(基)(応)(展):前述したとおりHAI分野における国内で網羅分野が最もフィットしている.
- 電子情報通信学会
- ヒューマンコミュニケーショングループ(基)(応)(展)
- ヒューマンコミュニケーション基礎研究会(HCS)(基)(応)(展)
- ヴァーバル・ノンヴァーバル・コミュニケーション研究会(VNV)(基)(展)
- 福祉情報工学研究会(WIT)(応)
- 情報の認知と行動研究会(ICB)(基)(展)
- メディアエクスペリエンス・バーチャル環境基礎研究会(MVE)(展)
- HI学会
- コミュニケーション支援(SIG-CE)(基)(応)
- 複合現実感,仮想都市,デバイスメディアおよび一般(SIG-DeMO)(展)
- 高齢者・障害者支援技術(SIG-ACI)(応)
- ユーザエクスペリエンス・サービスデザイン(SIG-UXSD)(展)
- 情報処理学会
- 人工知能学会系
- 日本認知科学会
- 人間工学会
- 感性情報処理・官能評価部会(基)
- ビッグデータ人間工学研究部会(基)(展)
- ロボット学会
- 計算社会科学会(基)
5・ 3 研究プロジェクト・組織系
大型予算を取っている研究プロジェクトは全国に数々存在しているが,HAI に関わる特徴的な視点をもつ研究シリーズとして成果をおさめているものがあるため,ここに新旧いくつかを取り上げる.
- 記号創発ロボティクス(オリジナルサイト)(基)(展):認知発達や知能形成の過程をロボットを通して検証し人間を理解する学問.赤ちゃんロボット(浅田共創知能システムプロジェクト)にも通ずる.
- ソフトロボティクス(基)(展):柔軟で有機的な構造と動きを実現しようという分野・プロジェクト.
- ソフトロボティクス関連の書籍文献
- その他 共生インタラクションCREST(間瀬健二先生) 関係
- その他 科学研究費助成事業系
- ムーンショット系
5・ 4 研究室など(高校生・受験生向け)
6.お わ り に
本稿ではHuman-Agent Interactionにおけるトピックの整頓や関連する研究コミュニティの紹介を行った.シンギュラリティがAI分野で一時期強く取り上げられたが,情報技術のインタラクションデザインにおいては,知的支援と情緒的共感の2 方向に分かれた研究開発ののち合流していくと考えている.その際にある脅威を強く感じる人も多いが,人間の情緒的・社会的QOL を高めていく希望でもあり,SDGs的にそのQOLをさまざまな人に保障する技術的革新をもたらす可能性もある.
人間の代替としてのエージェントと人間以上の人間を求めるような高度化とは別に,いかにユーザの生活を豊かにするかという観点をもち続けることで,脅威のリスクに向き合うこともできる.人間ユーザの「情」を満たすメディアとして,さらに,擬人化メディア自身の「情」を含みつつそれも満たすメディアとして,人間だけでなく人工物のQOLも向上させるような共生的未来を,研究者や開発者全員が真剣にデザインし続けることが,HAI分野において今後必要不可欠となるだろう.
最後に,文献・リンク類はあくまで抜粋であり,HAI関連分野が非常に広いことを鑑みつつヒントとしていただけることを願う.
謝 辞
本研究は科研費19H04154,19K12090,18K11383,JST,CREST JPMJCR18A1,および2019年関西大学研修員研修費の助成を一部受け実施したものです.執筆に際して有意義な資料やコメントを下さった大澤博隆先生(筑波大学),共同研究者で筆者の研究室所属学生の頃より本研究内容に長く従事してくださっている吉田直人先生(名古屋大学),ロボット実装で長く共同研究に携わってくださり本稿にコメント下さった山添大丈先生(兵庫県立大学),HAI研究分野のプロジェクトについてコメントいただいた塩見昌裕室長(ATR深層インタラクション総合研究所)に深くお礼申し上げます.この機会を与えてくださった人工知能学会誌編集委員会に心より感謝申し上げます.