1E4-05 自己相関性に基づくWebページラッパー作成アルゴリズムについて
5月29日(水) 自然言語情報検索 16:50-18:50 (E会場)
概要: 従来の木構造に基づくWebページラッパー作成アルゴリズムは,繰り返しを含むWebページ(リストなど)をうまく扱えないと言う欠点があった.本研究では,繰り返しを含むWebページの自己相関性に着目し,繰り返し構造に対応したラッパーを生成可能なアルゴリズムを実現した.