【講演概要】

特許・技術文書からの発明効果部分自動抽出

○佐藤 浩明、湯川 高志 (長岡技術科学大学)



本稿では特許・技術文書において「何をどうした」発明であるか抽出するために、 本文中において「何を」「どうした」の部分にそれぞれ自動でタグ付与を行う手法を提案し、 NTCIR-8 Patent Mining Task データセットを利用して評価した。 本稿では、係り受け解析器を利用したCRF(Conditional Random Field) のトレーニング用データ拡張を行うことによって「どうした」 の部分に対してタグ付与を行う手法と、その近傍で手掛かり表現を利用して 「何を」に対してタグ付与を行う手法を提案し、 評価した。その結果、F値にして特許文書に対して0.506、技術文書に対して0.255を得ることができた。