笠原 要、Francis Bond、天野 成昭 (NTT コミュニケーション科学基礎研究所)
テキストに関わる情報処理の最近のトピックとして言葉の意味情報を前提としたシステムの提案があげられる。 言葉の意味をいかに工学的に表現し利用するかという課題が起こるが、これまでは、 処理の種類や目的に応じた言葉の意味データベースで個別に対応してきた。 しかし、実用的な意味データベースを構築するためには出来るだけ多数の語彙への対応が必要となるが、 データの整合性を保つのが規模が大きくなると難しくなる。必要十分な語彙数に限定してデータベースを構築すればいいのであるが、 どの程度の語彙を収録すれば十分であるかを定量的に示すのが困難であった。
我々は、これらの課題を解決する統合的な単語の意味に関するデータベースとして 「基本語彙データベース」の構築を進めている。 本講演では、基本語彙知識ベースの構築のアプローチおよび、基本語の選定、 基本語の意味記述の基本となるデータベースである「Lexeed」および、 その語義文の構文木データベースである「桧」について述べる。