特許
J-GLOBAL ID:200903002762561717

文書分類装置及び文書分類方法

発明者:
出願人/特許権者:
代理人 (1件): 外川 英明
公報種別:公開公報
出願番号(国際出願番号):特願2000-288127
公開番号(公開出願番号):特開2002-099555
出願日: 2000年09月22日
公開日(公表日): 2002年04月05日
要約:
【要約】【課題】 従来の技術では、分類特定誤りに影響の大きな文書が存在していた場合データベースを更新することになるため、分書分類に使用するデータベースに格納される文書数が膨大になればなるほど更新に必要な時間も増加し、こまめにデータベースを調整することが困難になる。【解決手段】 主データベース4aに格納された複数の登録文書データと文書データとの類似度を求め(ステップ307)分類特定した(ステップ310)後に、類似度が高い分類が誤特定データベース4bの誤り分類に含まれている場合(ステップ312)、上記文書データと誤特定データベースの当該誤り分類が付与された登録文書データとから類似度を求め(ステップ315)、類似度の高い登録文書データがあれば、そこに予め付与された正解分類も特定分類に追加する(ステップ317)。このような構成により、分類特定誤りを減少させることが可能となる。
請求項(抜粋):
予め分類が付与された複数の登録文書データと文書データとの類似度に基づいて当該文書データの分類を特定する文書分類装置において、予め分類が付与された複数の登録文書データを格納する第1のデータベースと、文書データの分類を特定する際に、正解分類と異なる誤り分類として分類特定の誤りを引き起こす登録文書データを上記正解分類及び誤り分類と共に格納する第2のデータベースと、文書データと上記第1のデータベース内の登録文書データ及び上記第2のデータベース内の登録文書データとの類似度を求め、この類似度に基づき分類を特定する分類特定手段と、を具備することを特徴とする文書分類装置。
IPC (3件):
G06F 17/30 210 ,  G06F 17/30 240 ,  G06F 17/30 350
FI (3件):
G06F 17/30 210 D ,  G06F 17/30 240 A ,  G06F 17/30 350 C
Fターム (5件):
5B075NR03 ,  5B075NR12 ,  5B075PR06 ,  5B075QM08 ,  5B075UU06

前のページに戻る