/ プログラム / 発表一覧 / 著者一覧 / jsai2008 ホーム

1I2-01 Wikipediaマイニングによる大規模Webオントロジの実現

6月11日(水) 13:40〜14:00 I会場
近未来チャレンジ「ニューチャレンジ」

演題番号1I2-01
題目Wikipediaマイニングによる大規模Webオントロジの実現
著者中山 浩太郎 (大阪大学大学院情報科学研究科)
原 隆浩 (大阪大学大学院情報科学研究科)
西尾 章治郎 (大阪大学大学院情報科学研究科)
時間6月11日(水) 13:40〜14:00
概要Wikipediaは我々人工知能研究者が最近手に入れた新しいフロンティアである.Wikipediaは,幅広い分野において膨大な概念が網羅されているだけでなく,知識抽出のためのコーパスとして興味深い特徴を数多く持っている.密なリンク構造や,URLにより語彙の意味が一意に特定できる点,200以上の言語をサポートしている点,質の高いアンカーテキストなどはWikipediaの持つWebコーパスとしての特徴の一例である.これらWikipediaの持つ特徴は,知識抽出のコーパスとして極めて有利に働くことが各種の研究によりここ数年で急速に解明されてきた.特に,概念同士の関係度を数値化した連想シソーラスの構築に極めて有効であることが種々の研究で証明されている.本チャレンジでは,連想シソーラスの研究からさらにもう一歩踏み出し,Wikipediaをマイニングすることで大規模Webオントロジを自動的に構築する研究開発に挑戦する.特に,リンク構造解析とテキストマイニング技術を融合することで,相互の解析手法の利点を活かした手法を開発する.具体的には,1) リンク構造解析により重要文を抽出し,意味関係の抽出精度を向上させる,2) アンカーテキスト解析などにより抽出した同義語を利用し,意味解析を高度化する,3) カテゴリリンクとテーブル情報を利用した半構造化データの解析技術との融合,などの研究を行い,本チャレンジの目標を実現する.本チャレンジによって大規模Webオントロジが実現されたときの社会的インパクトは大きい.これは,Wikipediaは一般的な概念から最新の概念まで幅広く網羅しているため,WordNetなどの既存オントロジの弱点を補う新しい情報基盤が実現できる可能性を持っているためである. しかし,その一方で技術的な課題も存在する.例えば,Wikipediaに掲載されている情報の信頼性が挙げられる.Wikipediaに虚偽の情報が掲載され,社会問題になるケースが増加している.また,日に日に増加する一方のWikipediaに対して解析処理を行う場合,スケーラビリティの高い解析手法を検討することは必要不可欠である.これらの技術的課題を本チャレンジの中で解決していく.
論文PDFファイル

/ プログラム / 発表一覧 / 著者一覧 / jsai2008 ホーム