Pat
J-GLOBAL ID:200903097594125281
文書分類プログラム、文書分類装置、および文書分類方法
Inventor:
,
,
,
Applicant, Patent owner:
Agent (1):
服部 毅巖
Gazette classification:公開公報
Application number (International application number):2005368274
Publication number (International publication number):2007172249
Application date: Dec. 21, 2005
Publication date: Jul. 05, 2007
Summary:
【課題】新着記事から最新のトピックに関する文書を適切に分類することができるようにする。【解決手段】重み設定手段2により、学習文書記憶手段1に格納されている学習文書1aa,1ab,・・・,1ba,1bb,・・・それぞれに関して、学習文書に付与された時刻情報で示される時刻から現在までの経過時間に応じた重みが設定され、学習文書の特徴を示す素性に対してその学習文書の重みが設定される。次に、学習手段3により、カテゴリに対する正例の学習文書1aa,1ab,・・・の素性のうち、重みの値が大きい素性ほどカテゴリの特徴を強く表しているものと評価され、各素性がカテゴリの特徴を示すか否かを示す学習結果が生成される。その後、分類対象文書7が入力されると、分類手段4により、学習手段3で生成された学習結果に基づいて、分類対象文書7がカテゴリに属するか否かが判断される。【選択図】図1
Claim (excerpt):
文書を内容に応じて分類するための文書分類プログラムにおいて、
コンピュータを、
時刻情報が付与された学習文書を、所定のカテゴリに属す正例と前記カテゴリに属さない負例とに分けて記憶する学習文書記憶手段、
前記学習文書記憶手段に格納されている前記学習文書それぞれに関して、前記学習文書に付与された前記時刻情報で示される時刻から現在までの経過時間を計算し、前記経過期間に応じた重みを設定し、前記学習文書の特徴を示す素性に対して前記学習文書の重みを設定する重み設定手段、
前記カテゴリに対する正例の前記学習文書の素性のうち、重みの値が大きい素性ほど前記カテゴリの特徴を強く表しているものと評価し、各素性が前記カテゴリの特徴を示すか否かを示す学習結果を生成する学習手段、
分類対象文書が入力されると、前記学習手段により生成された前記学習結果に基づいて、前記分類対象文書が前記カテゴリに属するか否かを判断する分類手段、
前記分類対象文書に対して前記時刻情報を付与し、前記分類手段において前記カテゴリに属すると判断された場合には、前記分類対象文書を正例の前記学習文書として前記学習文書記憶手段に格納し、前記分類手段において前記カテゴリに属さないと判断された場合には、前記分類対象文書を負例の前記学習文書として前記学習文書記憶手段に格納する学習文書格納手段、
前記分類手段において前記カテゴリに属すると判断された前記分類対象文書を表示する表示手段、
として機能させることを特徴とする文書分類プログラム。
IPC (2):
FI (3):
G06F17/30 210D
, G06F17/30 170A
, G06N3/00 560A
F-Term (3):
5B075ND03
, 5B075NR12
, 5B075UU06
Patent cited by the Patent:
Cited by applicant (2)
Cited by examiner (2)
Return to Previous Page