/ プログラム / 発表一覧 / 著者一覧 / jsai2008 ホーム

2G3-01 WWW sits the SAT- Measuring Relational Similarity on the Web

6月12日(木) 16:20〜17:40 G会場
自然言語処理 2

演題番号2G3-01
題目WWW sits the SAT- Measuring Relational Similarity on the Web
著者ボッレーガラ ダヌシカ (東京大学)
松尾 豊 (東京大学大学院工学系研究科)
石塚 満 (東京大学大学院情報理工学系研究科)
時間6月12日(木) 16:20〜16:40
概要本発表では単語間の関係類似性(relational similarity)をWeb検索エンジンをもちいて計算するアルゴリズムを提案する。例えば、駝鳥と鳥の間の関係とライオンと猫の間関係は、いずれも「XはY種の大きなものである」という関係で表すことができ、両単語対(駝鳥:鳥とライオン:猫)の間には高い関係類似性が成り立つ。本研究ではSAT英語類推(analogy)試験問題を学習データとして用い、Web上で単語間の関係を記述するために使われるパターンを自動生成しそれらのパターンを特徴量として用い、機械学習によって新たな関係類似度尺度を提案する。パターン生成にはWeb検索エンジンから容易に得られるスニペットを用いる。提案するアルゴリズムをつかってSAT英語試験問題に解答する。提案手法ではSAT問題に対して40%の正解率が得られる。これはWordNetなど人間が作った知識ベースや辞書を用いる従来研究とほぼ同等な正解率である。更に、提案手法を用いて固有名詞間の関係を分類する。尚、374個のSAT試験問題に解答するために先行研究で提案されたLRA(Latent Relational Analysis)手法はおよそ9日間が必要とするに対し、提案手法は僅か6時間以内で回答する。
論文PDFファイル

/ プログラム / 発表一覧 / 著者一覧 / jsai2008 ホーム