【講演概要】

概念ベース研究のその後
〜概念粒度の研究と形容詞ベースの研究を中心に〜

笠原 要 (NTT コミュニケーション科学基礎研究所),
金杉 友子, 永森 千晴 (NTT アドバンステクノロジー),
松澤 和光 (NTT サービスインテグレーション基盤研究所)



ことば工学研究のきっかけとなった「概念ベース」の研究について、 最近の研究状況を紹介する。概念ベースは単語の意味(概念)を 国語辞典情報を基に機械的に知識ベース化したものであり、 約4万語の概念を、各々約3千次元のベクトルで表している。 しかしその後1年を経過し、研究も種々の方向に発展している。主な成果は
  1. 9万語規模概念ベースの再構築
  2. コーパスの共起情報に基づく概念ベースの補強
    複合名詞の利用
  3. コーパスの共起情報に基づく概念ベースの補強
    形容詞について
  4. 概念ベースの情報検索システムへの応用
  5. 概念ベースの意志決定支援システムへの応用 等である。本稿では、これらのうち、ことば工学に関係の深い 成果として、1. および 3. から2つの話題を紹介する。