Pat
J-GLOBAL ID:200903099562666569
ルールベースモデルに基づくテキスト情報自動分類装置
Inventor:
,
Applicant, Patent owner:
Agent (1):
長澤 俊一郎 (外1名)
Gazette classification:公開公報
Application number (International application number):2001329238
Publication number (International publication number):2002202984
Application date: Oct. 26, 2001
Publication date: Jul. 19, 2002
Summary:
【要約】【課題】 全体の分類ルールの再編集(再学習)を行うことなく、ルールベースモデルに基づくテキスト情報自動分類装置の分類精度を改善すること。【解決手段】 カテゴリ別のサンプル文書11から学習処理部2において学習処理した分類ルール4を用いて、分類処理部3によりサンプル文書11自体を分類する。そして、分類間違いの文書を選別して、精度改善手段1により分類ルールの追加および/または変更を行い分類ルール4の改良処理を行い、自動分類処理の精度改善を行う。また、新規のサンプル文書が与えられた場合にも、再学習させるのではなく、そのサンプル文書の特徴素を抽出して、分類ルールを追加し分類ルールを更新させる。さらに、カテゴリ別のサンプル文書について、分類カテゴリの独立度を判断し、独立度の低いものに関して、特にどのようなカテゴリ間の独立度が低いかを示して、提供すべきサンプル文書の分布を指示する。
Claim (excerpt):
ルールベースの分類手段を用いたテキスト情報自動分類装置であって、分類精度を改善する精度改善手段を備え、上記精度改善手段は、分類カテゴリ付きのサンプル文書の自動分類結果より選別された分類間違いの文書、もしくは、新規の分類カテゴリ付きサンプル文書について、該文書に関連する特徴素を抽出し、上記分類手段の分類ルールから、上記文書もしくは上記特徴素に関連する分類ルールを選別し、分類ルールの重み変更および/または新規分類ルールの生成を行い自動分類結果の精度を改善することを特徴とするルールベースモデルに基づくテキスト情報自動分類装置。
IPC (5):
G06F 17/30 210
, G06F 17/30 170
, G06F 17/30 180
, G06F 17/30 240
, G06F 9/44 580
FI (5):
G06F 17/30 210 D
, G06F 17/30 170 A
, G06F 17/30 180 B
, G06F 17/30 240 A
, G06F 9/44 580 P
F-Term (6):
5B075ND03
, 5B075ND34
, 5B075NR03
, 5B075PR06
, 5B075QT01
, 5B075UU06
Patent cited by the Patent:
Article cited by the Patent:
Return to Previous Page