Pat
J-GLOBAL ID:200903055251836170

文書収集装置および方法

Inventor:
Applicant, Patent owner:
Agent (3): 澤田 俊夫 ,  宮田 正昭 ,  山田 英治
Gazette classification:公開公報
Application number (International application number):2004075221
Publication number (International publication number):2004303226
Application date: Mar. 16, 2004
Publication date: Oct. 28, 2004
Summary:
【課題】 一定の巡回期間内になるべく多くの文書について文書情報を取得できるようにする。 【解決手段】 文書情報取得部101は、収集情報格納部102の文書アドレス情報を用いて対象の文書サーバ13、14等から文書情報を取得する。収集情報格納部102は、収集対象文書の文書アドレスや、その文書の巡回履歴情報、取得履歴情報、更新履歴情報などを保持する。巡回判定部103は、収集情報格納部102に格納されている履歴情報にもとづいて、文書を巡回するか否かを決定し、巡回することが決定した文書の文書アドレス情報を出力する。判定規範情報設定部104は、収集情報格納部102に格納された情報を使って判定規範を決定し、巡回判定部103に判定規範情報を設定する。例えば、一定時間に巡回した累計文書数や、更新予測時刻の度数分布に基づいて判定規範を最適化する。【選択図】 図2
Claim (excerpt):
ネットワークを介して接続された文書サーバ上の文書を収集する文書収集装置において、 上記文書のアドレスに関連づけて巡回すべきかどうかを決定するための当該文書の巡回決定要素属性を記憶する巡回決定要素属性記憶手段と、 複数の基準のうちの1つを選択する手段と、 選択された基準に基づいて上記巡回決定要素属性記憶手段の文書の巡回決定要素属性に基づいて各文書を巡回すべきかどうかを決定する巡回決定手段と、 巡回すべきと決定されたときに当該文書にアクセスして新たに更新されたかどうかを判別し新たに更新されているときに当該文書を取得する文書取得手段とを有することを特徴とする文書収集装置。
IPC (3):
G06F13/00 ,  G06F12/00 ,  G06F17/30
FI (4):
G06F13/00 540B ,  G06F12/00 546P ,  G06F17/30 110C ,  G06F17/30 180Z
F-Term (4):
5B075KK02 ,  5B075QT10 ,  5B082GA08 ,  5B082HA08
Patent cited by the Patent:
Cited by applicant (2)
  • 情報収集方法
    Gazette classification:公開公報   Application number:特願平8-206144   Applicant:株式会社東芝
  • 米国特許明細書第5748954号「Method for searching a queued and ranked constructed catalog of files stored on a network」
Cited by examiner (1)

Return to Previous Page