特許
J-GLOBAL ID:200903061462839221
情報分類方法、装置及びシステム
発明者:
,
出願人/特許権者:
代理人 (1件):
鈴木 正剛
公報種別:公開公報
出願番号(国際出願番号):特願平9-334309
公開番号(公開出願番号):特開平11-167581
出願日: 1997年12月04日
公開日(公表日): 1999年06月22日
要約:
【要約】【課題】 高精度なテキスト分類が可能な情報分類装置を提供する。【解決手段】 テキスト入力部11、単語処理部12、ベクトル処理部13、学習特徴ベクトル集合ファイル14、類似度処理部15、カテゴリ決定部16を備え、外部または内部に文書データベース17を具備して情報分類装置1を構成する。単語処理部12では、学習テキストから抽出された各単語のカテゴリに対する重要度を単語の出現件数及びカテゴリ頻度に基づいて算出する。類似度処理部15では、当該重要度に基づいて算出された学習特徴ベクトル及び学習特徴ベクトル集合と分類対象テキストの特徴ベクトルとに基づいて類似度を算出する。カテゴリ決定部15では、算出値が最大となる類似度から所定数の対応カテゴリを分類対象テキストのカテゴリとして決定し、このカテゴリによって分類された分類対象テキストが文書データベース17に蓄積されるようにする。
請求項(抜粋):
属すべきカテゴリが既知の学習用テキストから単語を抽出し、抽出した単語毎に、その出現件数及び出現するカテゴリ数に基づく重要度を算出するとともに、算出された重要度を要素としてカテゴリ毎の特徴を表す学習特徴ベクトルを生成する過程と、カテゴリが不明な分類対象テキストに対して当該分類対象テキスト中の単語毎の出現頻度に基づく重要度を算出し、算出された重要度を要素としてテキスト毎の特徴を表す分類対象特徴ベクトルを生成する過程と、分類対象特徴ベクトルと前記カテゴリ毎の学習特徴ベクトルとの類似度を判定する過程とを含み、前記分類対象テキストとの類似度が所定範囲内の学習特徴ベクトルに対応するカテゴリを当該分類対象テキストに付与すべきカテゴリ候補とすることを特徴とする情報分類方法。
IPC (2件):
FI (4件):
G06F 15/401 310 D
, G06F 7/24 A
, G06F 15/40 370 A
, G06F 15/403 350 C
引用特許:
前のページに戻る