/ プログラム/ 発表一覧/ 著者一覧/ 企業展示一覧/ jsai2009ホーム /

2C3-3 圧縮された半構造化文書からの頻出木パターン発見

06月18日(Thu) 15:50〜17:10 C会場(ホール棟5F-53室)
2C3 機械学習・データマイニング「データマイニング3」

演題番号2C3-3
題目圧縮された半構造化文書からの頻出木パターン発見
著者村上 征嗣(京都大学)
土井 晃一郎(京都大学)
山本 章博(京都大学 大学院情報学研究科)
時間06月18日(Thu) 16:30〜16:50
概要本研究では木文法圧縮アルゴリズムにより圧縮された半構造化文書から頻出木パターン発見を行う手法を提案する。この手法は圧縮された半構造化文書を展開なしに扱い、データ圧縮を前処理として活用してより効率的な発見を行うことが可能としている。
論文PDFファイル