1E4-05 自己相関性に基づくWebページラッパー作成アルゴリズムについて

大囿 忠親 (名古屋工業大学 知能情報システム学科)
新谷 虎松 (名古屋工業大学 知能情報システム学科)


5月29日(水)   自然言語情報検索   16:50-18:50 (E会場)

概要:
従来の木構造に基づくWebページラッパー作成アルゴリズムは,繰り返しを含むWebページ(リストなど)をうまく扱えないと言う欠点があった.本研究では,繰り返しを含むWebページの自己相関性に着目し,繰り返し構造に対応したラッパーを生成可能なアルゴリズムを実現した.