Pat
J-GLOBAL ID:200903096769187556

重要文抽出方法、装置、プログラム、および同プログラムを記録した記録媒体

Inventor:
Applicant, Patent owner:
Agent (1): 金田 暢之 (外1名)
Gazette classification:公開公報
Application number (International application number):2001221289
Publication number (International publication number):2003036262
Application date: Jul. 23, 2001
Publication date: Feb. 07, 2003
Summary:
【要約】【課題】 重要文抽出において、重要度計算時に用いる重み付けの値を人手によらずに決定する。【解決手段】 まず、重要文、非重要文のラベルのついた訓練データを特徴ベクトルで表現する(ステップ11)。次に、訓練データを用いてSupport Vector Mchineにより分類器を構成する(ステップ12)。次に、重要文を抽出すべき文書中の各文を特徴ベクトルで表現する(ステップ13)。ここで、 Support Vector Mchineは、正例、負例を分離平面によって分離する。次に、ステップ12にて構成した分類器を用いてステップ13で得た各文の特徴ベクトルの、分離平面からの距離を求める(ステップ14)。次に、分離平面からの距離をsigmoid関数を用いて確率値に近似し(ステップ14)、高い確率値が与えられた文から順に必要に応じて重要文と判定する(ステップ15)。
Claim (excerpt):
正例、負例のラベルのついた、重要文抽出のための訓練データを特徴ベクトルで表現するステップと、前記訓練データを用いてSupport Vector Machine により分類器を構成するステップと、重要文を抽出すべき文書中の各文を特徴ベクトルで表現するステップと、前記分類器を用いて前記各文の特徴ベクトルの、分離平面からの距離を求めるステップと、前記分離平面からの各距離を確率値へ変換するステップと、前記確率値の高いものから順に必要な数だけを重要文と決定するステップを有する重要文抽出方法。
IPC (2):
G06F 17/30 220 ,  G06F 17/18
FI (2):
G06F 17/30 220 A ,  G06F 17/18 Z
F-Term (4):
5B056BB42 ,  5B056BB64 ,  5B056HH00 ,  5B075NS01

Return to Previous Page