笠原 要 (NTT コミュニケーション科学基礎研究所),
金杉 友子, 永森 千晴 (NTT アドバンステクノロジー),
松澤 和光 (NTT サービスインテグレーション基盤研究所)
ことば工学研究のきっかけとなった「概念ベース」の研究について、 最近の研究状況を紹介する。概念ベースは単語の意味(概念)を 国語辞典情報を基に機械的に知識ベース化したものであり、 約4万語の概念を、各々約3千次元のベクトルで表している。 しかしその後1年を経過し、研究も種々の方向に発展している。主な成果は
- 9万語規模概念ベースの再構築
- コーパスの共起情報に基づく概念ベースの補強
- 複合名詞の利用
- コーパスの共起情報に基づく概念ベースの補強
- 形容詞について
- 概念ベースの情報検索システムへの応用
- 概念ベースの意志決定支援システムへの応用 等である。本稿では、これらのうち、ことば工学に関係の深い 成果として、1. および 3. から2つの話題を紹介する。