/ プログラム/ 発表一覧/ 著者一覧/ 企業展示一覧/ jsai2009ホーム /

3B3-1 Wikipediaからの対訳用語対の抽出

06月19日(Fri) 13:00〜14:20 B会場(ホール棟5F-52室)
3B3 Webインテリジェンス「webマイニング4」

演題番号3B3-1
題目Wikipediaからの対訳用語対の抽出
著者岡崎 直観(東京大学)
劉 瀟(東京大学)
綱川 隆司(東京大学)
辻井 潤一(東京大学)
時間06月19日(Fri) 13:00〜13:20
概要ウィキペディアでは,同一の実体を複数の言語で説明することがあり,それらのエントリ間は言語横断リンクで結ばれる.そこで,本研究では言語横断リンクで結ばれたエントリ同士を並行コーパスと見なし,対訳用語対をマイニングする.提案手法は,単一言語に対して用語抽出を行い,その用語に対する訳語を,統計的機械翻訳に基づく翻訳確率,並行コーパス中における共起回数,言語を横断した用語周辺文脈の類似度で選出する.
論文PDFファイル