Pat
J-GLOBAL ID:200903033613378503

決定理論的ウェブクローリングおよびウェブページ変更予測

Inventor:
Applicant, Patent owner:
Agent (2): 谷 義一 ,  阿部 和夫
Gazette classification:公開公報
Application number (International application number):2005036827
Publication number (International publication number):2005228343
Application date: Feb. 14, 2005
Publication date: Aug. 25, 2005
Summary:
【課題】 コンピュータ環境における予測的ウェブクローリングを円滑に行うシステムおよび方法を提供する。【解決手段】 ウェブページのサブセットにおける変更の、予測的、ユーティリティに基づく、且つ決定理論確率の算定をもたらし、ウェブクローリングの性能を高め、ウェブページ情報が新鮮な状態に保たれるようにする。さらに、変更された確率が高いページを選択的にクローリングできるようにする。102はWEBクローラ・コンポーネント、104はバンドリング・コンポーネント、106は検索サーバ、108はマネージング・コンポーネントである。【選択図】 図1
Claim (excerpt):
ウェブクローリングを行うシステムであって、 ウェブクローリングを実施するか否か、いつウェブクローリングを実施するか、さらに、どのようにしてウェブクローリングを実施するかという判定に関して、予測分析を行うマネージングコンポーネントと、 前記予測分析に応じてウェブページのサブセットをクロールするウェブクローリングコンポーネントと、 を具備したことを特徴とするシステム。
IPC (2):
G06F17/30 ,  G06F13/00
FI (3):
G06F17/30 180Z ,  G06F17/30 419B ,  G06F13/00 540B
F-Term (2):
5B075KK02 ,  5B075QT10
Patent cited by the Patent:
Cited by examiner (1)
  • 検索システム
    Gazette classification:公開公報   Application number:特願平8-245049   Applicant:株式会社東芝
Article cited by the Patent:
Cited by examiner (8)
  • 自然言語処理エンジン
  • Optimal Crawling Strategies for Web Search Engines
  • Effective Page Refresh Policies for Web Crawlers
Show all

Return to Previous Page