1B1-03 時間差分に基づくWEBページからの情報抽出

笹野 直幸 (大阪大学大学院 基礎工学研究科)
松下 光範 (大阪大学大学院 基礎工学研究科) (日本電信電話株式会社 NTTコミュニケーション科学基礎研究所)
田村 坦之 (大阪大学大学院 基礎工学研究科)


5月29日(水)   近未来DSIU   9:30-11:50 (B会場)

概要:
本稿では、HTML で記述された定形度の高い Web ページから、天気予報等のように時々刻々と変化するデータを簡易な方法で抽出する手法を提案する。提案手法では、対象ページの時間的な差分を検出することにより、データ箇所を特定する。そして、類似した情報を提供する複数のページ間の時間差分を比較することにより抽出したデータの属性、及びデータ間のリレーション判別を行う。

キーワード: DSIU