特許
J-GLOBAL ID:200903055265572108

情報分類方法及び装置

発明者:
出願人/特許権者:
代理人 (1件): 鈴木 正剛
公報種別:公開公報
出願番号(国際出願番号):特願平9-274528
公開番号(公開出願番号):特開平11-110409
出願日: 1997年10月07日
公開日(公表日): 1999年04月23日
要約:
【要約】【課題】 テキストの高精度な分類が可能となる情報分類装置を提供する。【解決手段】 テキスト入力部11、単語処理部12、特徴ベクトル処理部13、類似度処理部14、カテゴリ決定部15を備え、外部または内部に、文書データベース16及び学習特徴ベクトル集合ファイル17を具備して情報分類装置1を構成する。特徴ベクトル処理部13は、新規テキストにおける各項目毎の部分特徴ベクトル及び各カテゴリ毎の特徴ベクトル集合を生成する。類似度処理部14は、既存の分類体系に基づく学習テキストと新規テキストとの類似度を算出する。カテゴリ決定部15では、類似度がより高いカテゴリから所定数個のものを新規テキストのカテゴリとして決定し、新規テキストの分類を行う。分類後の新規テキストは、文書データベース16に追加登録される。
請求項(抜粋):
予め項目分けされ、カテゴリが付与されている複数の学習テキストの各々から項目毎の特徴を表す学習特徴ベクトルと項目数に応じた数の学習特徴ベクトルの組から成る学習特徴ベクトル集合とを生成しておき、カテゴリが不明な新規テキストが入力されたときに、当該新規テキストに対して前記学習特徴ベクトル及び学習特徴ベクトル集合と同一形式の分類対象特徴ベクトル及び分類対象特徴ベクトル集合を生成するとともに、個々の分類対象特徴ベクトルと前記学習特徴ベクトルとの特徴差に基づいて前記分類対象特徴ベクトル集合に対する各カテゴリの学習特徴ベクトル集合の類似度を判定し、判定結果に基づいて前記新規テキストのカテゴリを特定することを特徴とする情報分類方法。
IPC (2件):
G06F 17/30 ,  G06F 15/18 560
FI (2件):
G06F 15/401 310 D ,  G06F 15/18 560 A

前のページに戻る