特許
J-GLOBAL ID:200903073583061528
情報検索システム、情報検索方法、HTML文書の構造解析方法及びプログラム
発明者:
,
出願人/特許権者:
代理人 (4件):
坂口 博
, 市位 嘉宏
, 上野 剛史
, 古部 次郎
公報種別:公開公報
出願番号(国際出願番号):特願2002-211634
公開番号(公開出願番号):特開2004-054631
出願日: 2002年07月19日
公開日(公表日): 2004年02月19日
要約:
【課題】コンピュータを用いた情報検索において、情報の使用目的に応じて多様な戦略による柔軟な情報検索を効果的に実現する。【解決手段】所定のウェブページにおける意味を考慮してHTML文書の構造を解析する文書構造解析部12と、この解析結果に基づき、予め定められた戦略にしたがって、このウェブページからリンクされる他のウェブサイトの重要度を計算する重要度計算部13と、この重要度計算部13により計算された重要度に応じてウェブサイトをクロールするクローリング実行部14とを備える。【選択図】 図2
請求項(抜粋):
ネットワークを介してウェブサイトのクローリングを行う情報検索システムにおいて、
所定のウェブページにおける意味を考慮してソースコードの構造を解析する構造解析部と、
前記構造解析部の解析結果に基づいて、前記所定のウェブページからリンクされる他のウェブサイトの重要度を計算する重要度計算部と、
前記重要度計算部により計算された重要度に応じてウェブサイトをクロールするクローリング実行部と
を備えることを特徴とする情報検索システム。
IPC (3件):
G06F17/30
, G06F12/00
, G06F13/00
FI (6件):
G06F17/30 110F
, G06F17/30 140
, G06F17/30 170A
, G06F17/30 419B
, G06F12/00 546P
, G06F13/00 540F
Fターム (14件):
5B075KK07
, 5B075ND03
, 5B075ND36
, 5B075NK02
, 5B075NK44
, 5B075NR02
, 5B075NR20
, 5B075PP13
, 5B075PP22
, 5B075PQ02
, 5B075PQ38
, 5B075PQ75
, 5B075PR08
, 5B082GC04
引用特許:
前のページに戻る