Pat
J-GLOBAL ID:200903061462839221

情報分類方法、装置及びシステム

Inventor:
Applicant, Patent owner:
Agent (1): 鈴木 正剛
Gazette classification:公開公報
Application number (International application number):1997334309
Publication number (International publication number):1999167581
Application date: Dec. 04, 1997
Publication date: Jun. 22, 1999
Summary:
【要約】【課題】 高精度なテキスト分類が可能な情報分類装置を提供する。【解決手段】 テキスト入力部11、単語処理部12、ベクトル処理部13、学習特徴ベクトル集合ファイル14、類似度処理部15、カテゴリ決定部16を備え、外部または内部に文書データベース17を具備して情報分類装置1を構成する。単語処理部12では、学習テキストから抽出された各単語のカテゴリに対する重要度を単語の出現件数及びカテゴリ頻度に基づいて算出する。類似度処理部15では、当該重要度に基づいて算出された学習特徴ベクトル及び学習特徴ベクトル集合と分類対象テキストの特徴ベクトルとに基づいて類似度を算出する。カテゴリ決定部15では、算出値が最大となる類似度から所定数の対応カテゴリを分類対象テキストのカテゴリとして決定し、このカテゴリによって分類された分類対象テキストが文書データベース17に蓄積されるようにする。
Claim (excerpt):
属すべきカテゴリが既知の学習用テキストから単語を抽出し、抽出した単語毎に、その出現件数及び出現するカテゴリ数に基づく重要度を算出するとともに、算出された重要度を要素としてカテゴリ毎の特徴を表す学習特徴ベクトルを生成する過程と、カテゴリが不明な分類対象テキストに対して当該分類対象テキスト中の単語毎の出現頻度に基づく重要度を算出し、算出された重要度を要素としてテキスト毎の特徴を表す分類対象特徴ベクトルを生成する過程と、分類対象特徴ベクトルと前記カテゴリ毎の学習特徴ベクトルとの類似度を判定する過程とを含み、前記分類対象テキストとの類似度が所定範囲内の学習特徴ベクトルに対応するカテゴリを当該分類対象テキストに付与すべきカテゴリ候補とすることを特徴とする情報分類方法。
IPC (2):
G06F 17/30 ,  G06F 7/24
FI (4):
G06F 15/401 310 D ,  G06F 7/24 A ,  G06F 15/40 370 A ,  G06F 15/403 350 C
Patent cited by the Patent:
Cited by examiner (1)

Return to Previous Page