演題番号 | 3B3-1 |
---|---|
題目 | Wikipediaからの対訳用語対の抽出 |
著者 | 岡崎 直観(東京大学) 劉 瀟(東京大学) 綱川 隆司(東京大学) 辻井 潤一(東京大学) |
時間 | 06月19日(Fri) 13:00〜13:20 |
概要 | ウィキペディアでは,同一の実体を複数の言語で説明することがあり,それらのエントリ間は言語横断リンクで結ばれる.そこで,本研究では言語横断リンクで結ばれたエントリ同士を並行コーパスと見なし,対訳用語対をマイニングする.提案手法は,単一言語に対して用語抽出を行い,その用語に対する訳語を,統計的機械翻訳に基づく翻訳確率,並行コーパス中における共起回数,言語を横断した用語周辺文脈の類似度で選出する. |
論文 | PDFファイル |