特許
J-GLOBAL ID:200903030484732614

文書収集装置、文書検索装置及び文書収集検索システム

発明者:
出願人/特許権者:
代理人 (1件): 工藤 宣幸
公報種別:公開公報
出願番号(国際出願番号):特願2003-315703
公開番号(公開出願番号):特開2005-084904
出願日: 2003年09月08日
公開日(公表日): 2005年03月31日
要約:
【課題】 文書同一性判定処理を効率的にする文書収集装置、文書検索装置及び文書収集検索システムを提供する。【解決手段】 同一文書データが存在するか否かを示す同一文書情報を、各文書データに対応付けて保存する文書データベースと、文書収集時に、収集対象文書データに対応する文書データが文書データベースに保存されている場合に、文書同一性判定手段の判定結果に応じて文書データベースの同一文書情報を更新する文書情報更新手段を備える文書収集装置と、文書検索時に、文書検索手段が検索した文書データの同一文書情報から同一文書データのうち1個の文書データ以外の残りの同一文書データを除去する同一文書除去手段と、残された各文書データについての検索文書同一性判定手段の判定結果に応じて文書データベースの同一文書情報を更新する検索文書情報更新手段とを備える文書検索装置とを有する文書収集検索システム。【選択図】 図1
請求項(抜粋):
文書内容が同一である同一文書データが存在するか否かを示す同一文書情報を、各文書データに対応付けて保存している文書データベースに、外部から収集した文書データを保存させる文書収集装置であって、 収集対象文書データに対応する文書データが、上記文書データベースに保存されているか否かを確認する保存文書確認手段と、 上記収集対象文書データに対応する文書データが上記文書データベースに保存されている場合に、上記収集対象文書データに対応する文書データの上記同一文書情報に基づいて、上記収集対象文書データに対応する文書データの同一文書データが、上記文書データベースに存在するか否かを確認する同一文書存在確認手段と、 上記収集対象文書データに対応する文書データの同一文書データが上記文書データベースに存在する場合、上記収集対象文書データを取得すると共に、上記収集対象文書データに対応する文書データ及び上記同一文書データを取得する文書取得手段と、 取得した上記収集対象文書データに対応する文書データ及び上記同一文書データの文書内容と、取得した上記収集対象文書データの文書内容との同一性を判定する文書同一性判定手段と、 上記文書同一性判定手段の判定結果に応じて、取得した各文書データについての上記文書データベースの同一文書情報を更新する文書情報更新手段と を備えることを特徴とする文書収集装置。
IPC (1件):
G06F17/30
FI (3件):
G06F17/30 170A ,  G06F17/30 180Z ,  G06F17/30 350A
Fターム (4件):
5B075ND03 ,  5B075QM01 ,  5B075QS20 ,  5B075UU06
引用特許:
出願人引用 (1件) 審査官引用 (2件)
引用文献:
前のページに戻る