第66回 人工知能セミナー(2013.3.25)「対話する人工知能 ~音声対話システムチュートリアル~」


主催: (社)人工知能学会
日時: 2013年3月25日(月) 13:00-17:30
会場: キャンパスイノベーションセンター 多目的室3
(〒108-0023 東京都港区芝浦3-3-6、JR田町駅徒歩1分)
照会先: account@ai-gakkai.or.jp
定員: 45名 –受付は終了いたしました。お申込みありがとうございました。
参加費: 正会員 8,000円 (賛助会員の社員の方も含みます)
学生会員 2,000円,非会員 10,000円,学生非会員 4,000円

概要

人間と同様に音声で対話をするシステムは、古くから考えられてきた人工知能応用の理想の1つです。近年急速に普及している音声対話システムは、人間の細かい言い回しや機微のある表現を理解して知的な応答をすることを特徴としており、音声対話システムは単純な検索や制御を越えた新しい段階に入ったと考えられます。音声対話システムは多くの要素で構成されており、音声認識、人間の表現の理解、音声応答の生成などの技術についてそれぞれ研究開発が行われています。本セミナーでは音声対話システムの要素技術に関する研究開発について、横断的に紹介します。

本セミナーでは「音声対話システム」をテーマに、要素技術である対話制御、音声認識、音声合成の研究の第一人者がチュートリアル形式で講演を行います。

  • 音声対話システムの導入検討に向け、技術的な基礎知識や問題点を知りたい開発者
  • 関連分野の概要を理解し、専門技術の応用可能性について考えたい音声処理、対話制御の研究者
  • とりあえずスマートフォンで対話アプリを使ってみたけど実際にどんな処理をしているのか知りたい方

等々、音声対話システムに興味のある方は誰でも参加可能です。

数10名の会場でのチュートリアルと質疑応答を通して、音声対話システムを支える技術について理解を深める良い機会ですので、皆様奮ってご参加下さい。

プログラム

13:00 – 13:05 開会のご挨拶


13:05 – 14:05 「最新の音声認識技術」

松田繁樹(NICT)

概要: 音声翻訳に関する国際ワークショップ IWSLT2012 で行われた英語の講演音声(TED) を対象とした音声認識性能コンペティションにおいて、NICT のシステムは 1 位を獲得した。 本講演では、NICT や世界各国の研究機関が提案する音声認識システムにおいて用いられた技術について概説する


14:05 – 15:05 「対話システムの概要と発話理解・生成技術」

東中竜一郎(NTT)

概要: 対話システムの歴史と主な仕組み,そして,対話システム研究の現状を解説する。 また,対話システムのコンポーネントのうち,ユーザ発話の意図理解を行う発話理解部と,システムの発話意図を発話に変換する発話生成部について,特に取り上げて解説する.


15:05 – 15:15 休憩


15:15 – 16:15 「データに基づく対話制御」

南泰浩(NTT)

概要: これまでの対話制御は,制御の手順をあらかじめプログラムあるいは,ルールによって記述することがほとんであった.ここでは,これらの手順をデータに基づき自動あるいは半自動的に構成する手法について概観する。 特に,統計的手法で対話制御を行うPOMDPによる対話制御手法と,Siriと関係の深いDARPAのCALOによる統一的なオントロジーを用いる対話制御手法について詳説する.


16:15 – 17:15 「テキスト音声合成技術」

籠嶋岳彦(東芝)

概要: 近年の音声対話システムは、Webなどの膨大な背景知識に基づいて多様な応答を生成するため、任意の入力テキストを音声に変換するテキスト音声合成技術が必要である。 ビジュアルなキャラクターが設定されている対話システムでは、単に言語情報を伝達するだけで無く、外見に即した個人性や感情を表現することが、合成音声に求められるようになってきた。 本講演では、テキスト音声合成の基本的な原理について概説し、話者性のカスタマイズや感情表現技術の現状について述べる。


17:15 – 17:20 閉会のご挨拶