特許
J-GLOBAL ID:200903099562666569

ルールベースモデルに基づくテキスト情報自動分類装置

発明者:
出願人/特許権者:
代理人 (1件): 長澤 俊一郎 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願2001-329238
公開番号(公開出願番号):特開2002-202984
出願日: 2001年10月26日
公開日(公表日): 2002年07月19日
要約:
【要約】【課題】 全体の分類ルールの再編集(再学習)を行うことなく、ルールベースモデルに基づくテキスト情報自動分類装置の分類精度を改善すること。【解決手段】 カテゴリ別のサンプル文書11から学習処理部2において学習処理した分類ルール4を用いて、分類処理部3によりサンプル文書11自体を分類する。そして、分類間違いの文書を選別して、精度改善手段1により分類ルールの追加および/または変更を行い分類ルール4の改良処理を行い、自動分類処理の精度改善を行う。また、新規のサンプル文書が与えられた場合にも、再学習させるのではなく、そのサンプル文書の特徴素を抽出して、分類ルールを追加し分類ルールを更新させる。さらに、カテゴリ別のサンプル文書について、分類カテゴリの独立度を判断し、独立度の低いものに関して、特にどのようなカテゴリ間の独立度が低いかを示して、提供すべきサンプル文書の分布を指示する。
請求項(抜粋):
ルールベースの分類手段を用いたテキスト情報自動分類装置であって、分類精度を改善する精度改善手段を備え、上記精度改善手段は、分類カテゴリ付きのサンプル文書の自動分類結果より選別された分類間違いの文書、もしくは、新規の分類カテゴリ付きサンプル文書について、該文書に関連する特徴素を抽出し、上記分類手段の分類ルールから、上記文書もしくは上記特徴素に関連する分類ルールを選別し、分類ルールの重み変更および/または新規分類ルールの生成を行い自動分類結果の精度を改善することを特徴とするルールベースモデルに基づくテキスト情報自動分類装置。
IPC (5件):
G06F 17/30 210 ,  G06F 17/30 170 ,  G06F 17/30 180 ,  G06F 17/30 240 ,  G06F 9/44 580
FI (5件):
G06F 17/30 210 D ,  G06F 17/30 170 A ,  G06F 17/30 180 B ,  G06F 17/30 240 A ,  G06F 9/44 580 P
Fターム (6件):
5B075ND03 ,  5B075ND34 ,  5B075NR03 ,  5B075PR06 ,  5B075QT01 ,  5B075UU06
引用特許:
審査官引用 (3件)
引用文献:
前のページに戻る