/ プログラム/ 発表一覧/ 著者一覧/ 企業展示一覧/ jsai2010ホーム /

1A2-4 文字列カーネルと動的計画法を用いたテキスト・音声のトピック分割アルゴリズム

06月09日(Wed) 13:00〜14:20 A会場(3F-会議室1)
1A2 機械学習「クラスタリング」

演題番号1A2-4
題目文字列カーネルと動的計画法を用いたテキスト・音声のトピック分割アルゴリズム
著者佐土原 健((独)産業技術総合研究所)
時間06月09日(Wed) 14:00〜14:20
概要テキスト・音声等から得られる符号系列に対し、符号の出現パターンの同質性に着目して、意味的に同質な部分区間に分割する領域非依存なトピック分割アルゴリズムを提案する。全ての(ギャップを含む)部分符号列の出現頻度に基づく任意の部分区間の類似性を文字列カーネルを用いて計算し、動的計画法により最適な分割を計算するこのアルゴリズムを、テキスト・音声コーパスに適用し、既存手法との性能比較を行う。
論文PDFファイル