特許
J-GLOBAL ID:200903063372674161

情報収集システム、情報収集方法、及び情報収集プログラム

発明者:
出願人/特許権者:
代理人 (3件): 岸田 正行 ,  水野 勝文 ,  小川 英宣
公報種別:公開公報
出願番号(国際出願番号):特願2003-115226
公開番号(公開出願番号):特開2004-318746
出願日: 2003年04月21日
公開日(公表日): 2004年11月11日
要約:
【課題】公開された情報を効率良く高速に収集するシステム等を提供する。【解決手段】一サイト内の一ページにそれぞれアクセスして、該サイトを構成する複数のコンテンツについての各種データを収集し処理するための複数のデータ処理手段14と、該手段を管理する管理手段と、を備えたデータ処理装置10と、該装置10が最初にアクセスするサイトを示す情報が含まれた特定サイト情報と、該サイト内の各コンテンツについての情報と、を記憶する記憶装置20と、を有し、データ処理手段14は、特定サイト情報に基づくページへのアクセス、該ページのヘッダ情報の取得、コンテンツの取得、リンク情報の取得、各情報に基づく所定情報の記憶装置20への登録、を行い、管理手段は、記憶装置20内の情報及びリンク情報に基づきデータ処理手段14を1以上起動させる処理と、リンク情報に基づき該サイトに対するデータ収集を終了させる処理と、を行う。【選択図】 図1
請求項(抜粋):
一のサイト内の一のページにそれぞれアクセスして、当該サイトを構成する複数のコンテンツについての各種データを収集し、処理するための複数のデータ処理手段と、前記データ処理手段を管理する管理手段と、を備えたデータ処理装置と、 前記データ処理装置が最初にアクセスするためのサイトを示す情報が含まれた特定サイト情報と、当該サイト内の各コンテンツについての情報と、を少なくとも記憶するための記憶装置と、を有し、 前記データ処理装置の前記データ処理手段は、予め前記記憶装置に記憶された前記特定サイト情報に基づくページ、及び、該ページにリンクされたリンクページにアクセスするためのページアクセス手段と、アクセスしたページのヘッダ情報を取得するヘッダ情報取得手段と、アクセスしたページのコンテンツを取得するためのコンテンツ取得手段と、アクセスしたページにリンクされたリンクページの場所を示すリンク情報を取得するリンク情報取得手段と、取得した各情報に基づく所定の情報を前記記憶装置に登録する情報登録手段とを有し、 前記データ処理装置の前記管理手段は、前記記憶装置に記憶された情報及び前記リンク情報取得手段で取得したリンク情報に基づいて、前記データ処理手段をn(nは1以上)個起動させる起動管理手段と、前記リンク情報取得手段で取得したリンク情報に基づいて、当該サイトに対するデータ収集を終了させる終了管理手段と、 を備えたことを特徴とする情報収集システム。
IPC (2件):
G06F17/30 ,  G06F13/00
FI (5件):
G06F17/30 180Z ,  G06F17/30 110F ,  G06F17/30 419B ,  G06F13/00 540B ,  G06F13/00 540C
Fターム (4件):
5B075ND03 ,  5B075ND12 ,  5B075ND36 ,  5B075PQ05

前のページに戻る