特許
J-GLOBAL ID:201103036040961605

文書分類装置、文書分類方法及び記憶媒体

発明者:
出願人/特許権者:
代理人 (1件): 鈴木 均
公報種別:特許公報
出願番号(国際出願番号):特願平11-282014
公開番号(公開出願番号):特開2001-101227
特許番号:特許第4143234号
出願日: 1999年10月01日
公開日(公表日): 2001年04月13日
請求項(抜粋):
【請求項1】 文書の内容に従って文書集合を自動的に分類する文書分類装置において、 複数の文書から成る文書集合のそれぞれの文書データ中の単語を抽出し、該抽出された単語の出現回数を前記文書ごとに計数する文書解析手段と、 前記文書解析手段で得られた単語と単語の出現回数とに基づき、前記各文書と各文書に出現する単語とがそれぞれ行列成分に対応し、各行列要素が前記文書ごとに計数された前記単語の出現回数である行列を生成し、該行列に特異値分解を用いて文書特徴ベクトルを求める特徴ベクトル生成手段と、 前記文書特徴ベクトルにおける対応する特異値が大きい順に特徴次元を削除して当該文書特徴ベクトルを修正する特徴ベクトル修正手段と、 該特徴ベクトル修正手段により修正された前記文書特徴ベクトルを含む文書特徴ベクトル間の類似度に基づいて文書集合を複数の部分文書集合に分類し、分類結果を分類結果記憶手段に記憶させる文書分類手段と、 を備え、 前記文書分類手段が前記分類結果を記憶させた後、所定のくり返し条件を用いた判定に従い、くり返すと判定された場合、前記特徴ベクトル修正手段が文書特徴ベクトルを修正する動作および前記文書分類手段が文書集合を部分文書集合に分類して前記分類結果記憶手段に分類結果を記憶する動作をくり返すことを特徴とする文書分類装置。
IPC (1件):
G06F 17/30 ( 200 6.01)
FI (2件):
G06F 17/30 210 D ,  G06F 17/30 170 A
引用特許:
審査官引用 (4件)
全件表示
引用文献:
前のページに戻る