/ プログラム / 発表一覧 / 著者一覧 / jsai2008 ホーム

2I1-04 Webページにおけるレイアウト情報を考慮したDOMの拡張

6月12日(木) 09:00〜10:20 I会場
認知/対話モデル・Webインテリジェンス

演題番号2I1-04
題目Webページにおけるレイアウト情報を考慮したDOMの拡張
著者浅見 昌平 (名古屋工業大学大学院工学研究科情報工学専攻)
伊藤 太樹 (名古屋工業大学大学院工学研究科情報工学専攻)
大囿 忠親 (名古屋工業大学大学院 工学研究科情報工学専攻)
新谷 虎松 (名古屋工業大学大学院 工学研究科情報工学専攻)
時間6月12日(木) 10:00〜10:20
概要DOMはWebページを構成するHTML要素を操作するAPIである.DOMの問題点として,Webページにおけるレイアウト情報を参照できないことが挙げられる.例えば,TABLE要素は表を構成する以外に,ページのレイアウトを整形する目的で使われる.この場合,DOMにアクセスするアプリケーションは,TABLE要素がどちらの用途で使われているか判断できない.本研究では,DOM木を拡張し,Webページにおけるレイアウト情報が参照可能な構造へ変換する.拡張したDOM木を用いることで,HTML文書から抽出が困難な要素同士の位置関係,および要素の分類を参照することができる.
論文PDFファイル

/ プログラム / 発表一覧 / 著者一覧 / jsai2008 ホーム