Pat
J-GLOBAL ID:200903033613378503
決定理論的ウェブクローリングおよびウェブページ変更予測
Inventor:
,
Applicant, Patent owner:
Agent (2):
谷 義一
, 阿部 和夫
Gazette classification:公開公報
Application number (International application number):2005036827
Publication number (International publication number):2005228343
Application date: Feb. 14, 2005
Publication date: Aug. 25, 2005
Summary:
【課題】 コンピュータ環境における予測的ウェブクローリングを円滑に行うシステムおよび方法を提供する。【解決手段】 ウェブページのサブセットにおける変更の、予測的、ユーティリティに基づく、且つ決定理論確率の算定をもたらし、ウェブクローリングの性能を高め、ウェブページ情報が新鮮な状態に保たれるようにする。さらに、変更された確率が高いページを選択的にクローリングできるようにする。102はWEBクローラ・コンポーネント、104はバンドリング・コンポーネント、106は検索サーバ、108はマネージング・コンポーネントである。【選択図】 図1
Claim (excerpt):
ウェブクローリングを行うシステムであって、
ウェブクローリングを実施するか否か、いつウェブクローリングを実施するか、さらに、どのようにしてウェブクローリングを実施するかという判定に関して、予測分析を行うマネージングコンポーネントと、
前記予測分析に応じてウェブページのサブセットをクロールするウェブクローリングコンポーネントと、
を具備したことを特徴とするシステム。
IPC (2):
FI (3):
G06F17/30 180Z
, G06F17/30 419B
, G06F13/00 540B
F-Term (2):
Patent cited by the Patent:
Cited by examiner (1)
-
検索システム
Gazette classification:公開公報
Application number:特願平8-245049
Applicant:株式会社東芝
Article cited by the Patent:
Cited by examiner (8)
-
自然言語処理エンジン
-
Optimal Crawling Strategies for Web Search Engines
-
Effective Page Refresh Policies for Web Crawlers
-
A Data-Mining Approach for Optimizaing Performance of an Incremental Crawler
-
確率モデルによるWebデータ解析法(原題:Modeling the Internet and the Web), 20070531, 第1版, p.163-186
-
Optimal Crawling Strategies for Web Search Engines
-
A Data-Mining Approach for Optimizaing Performance of an Incremental Crawler
-
確率モデルによるWebデータ解析法(原題:Modeling the Internet and the Web), 20070531, 第1版, p.163-186
Show all
Return to Previous Page