特許
J-GLOBAL ID:200903029462712166

文書分類装置、文書分類方法、及びデータベース更新方法

発明者:
出願人/特許権者:
代理人 (1件): 外川 英明
公報種別:公開公報
出願番号(国際出願番号):特願平11-335442
公開番号(公開出願番号):特開2001-155025
出願日: 1999年11月26日
公開日(公表日): 2001年06月08日
要約:
【要約】【課題】 従来の文書分類装置においては、文書分類のために用いるデータベースを文書の検索精度を低下させないよう効率的に更新することについて考慮されていなかった。【解決手段】 文書分類装置に用いるデータベースに関し、文書データとデータベース内の登録文書データとの類似度を算出し、この算出された類似度を、上記登録文書データの分類と上記文書データの分類とが一致している場合正解影響度とし、上記登録文書データの分類と上記文書データの分類とが不一致の場合不正解影響度として記憶し、上記正解影響度及び不正解影響度に応じて登録文書データの分類別に上記データベースから削除するようにデータベースの更新を行なうようにしたため、登録された文書の数を不必要に増加させずにデータベース中の同一分類の中で使用される単語に時間の経過に伴う変化が生じる場合でも適切な分類付与を行なうことができるようになる。
請求項(抜粋):
予め分類が付与された複数の登録文書データを格納するデータベースと、このデータベースに含まれない文書データを入力する第1の入力手段と、この入力された文書データと上記データベース内の登録文書データとの類似度を算出する算出手段と、この算出手段にて算出された類似度を出力する第1の出力手段と、上記算出手段で求められた類似度を、上記文書データに付与されるべき正解分類に一致すれば正解影響度とし、上記正解分類に不一致であれば不正解影響度として記憶する記憶手段と、この記憶手段に記憶された各登録文書データの上記正解影響度及び不正解影響度に応じて上記データベースから削除すべきものを出力する第2の出力手段と、を具備することを特徴とする文書分類装置。
FI (2件):
G06F 15/40 370 A ,  G06F 15/401 310 D
Fターム (7件):
5B075ND03 ,  5B075NR03 ,  5B075NR12 ,  5B075PP02 ,  5B075PQ02 ,  5B075PR06 ,  5B075QM08

前のページに戻る