特許
J-GLOBAL ID:200903036767621949

文書分類装置及び文書分類方法

発明者:
出願人/特許権者:
代理人 (1件): 伊東 忠彦
公報種別:公開公報
出願番号(国際出願番号):特願2000-148443
公開番号(公開出願番号):特開2001-331514
出願日: 2000年05月19日
公開日(公表日): 2001年11月30日
要約:
【要約】【課題】 ユーザの意図に沿わない文書分類が行われることを防止し、簡便に、初期分類代表特徴ベクトルを生成することが可能な文書分類装置及び文書分類方法を目的とする。【解決手段】 文書入力部101と、文書データの単語を解析する文書解析部102と、文書に対する文書特徴ベクトルを算出する文書特徴ベクトル生成部103と、文書特徴ベクトルと同じ次元数を持つ分類代表ベクトルを生成する分類代表ベクトル生成部104と、精錬化処理を行わない分類代表ベクトルを指定する精錬化除外ベクトル指定部105と、文書データを分類代表ベクトルのいづれか一つに割り当てる文書データ割り当て部106と、精錬化除外ベクトルを除いて、文書データ割り当て部にて割り当てられた文書特徴ベクトルをもとに分類代表ベクトルを再計算する分類代表ベクトル精錬化部107と、分類結果保存部108とを有する文書分類装置。
請求項(抜粋):
複数の初期分類代表特徴ベクトルを設定し、該分類代表特徴ベクトルと文書の特徴ベクトルとの類似性をもとに文書を分類する文書分類装置において、分類精度向上のため動的に分類代表特徴ベクトルを変化させて、反復的に文書の割り当てを行う精錬化処理部を有し、該精錬化処理部は、一部又は全部の前記分類代表特徴ベクトルについて、精錬化処理を行わないことを特徴とする文書分類装置。
IPC (3件):
G06F 17/30 210 ,  G06F 17/30 170 ,  G06F 17/30 350
FI (3件):
G06F 17/30 210 D ,  G06F 17/30 170 A ,  G06F 17/30 350 C
Fターム (4件):
5B075ND03 ,  5B075NR12 ,  5B075PP02 ,  5B075QM06

前のページに戻る