Pat
J-GLOBAL ID:200903026389066731
Webサイト検索方法とシステム、並びに、この方法の実行プログラムとこの方法の実行プログラムを記録した記録媒体
Inventor:
Applicant, Patent owner:
Agent (1):
志賀 富士弥 (外2名)
Gazette classification:公開公報
Application number (International application number):2001389446
Publication number (International publication number):2003186901
Application date: Dec. 21, 2001
Publication date: Jul. 04, 2003
Summary:
【要約】【課題】 Webページ検索システムへの検索要求にヒットしたページ単位の検索結果を、検索要求に適合している順番にサイト単位で出力する。【解決手段】 検索クライアント3は、Webページ検索システム1に対しキーワード等による検索要求を行い、検索システム1からヒットしたページのスコアとURLをN件受け取る。検索クライアント3のランキング手段31は、ページDB23にアクセスし、各ページのサイトIDとサイト木構造のルートからの深さを得、サイト木構造の深さとスコアを基に検索要求への適合度を表す得点を計算し、ヒットサイトリストにサイトIDを登録して該得点をその得点要素とする。あるいは、サイトIDが既登録の場合はその得点要素に加算する。この得点要素でヒットサイトリストをソートし、上位M件のサイトをサイト情報DB24から得られたそのサイトのURLとともに検索結果として出力する。
Claim (excerpt):
Webページ集合を収集し、このWebページ集合からWebサイトのトップページを推定してページ単位にサイトIDとそのトップページのURLを第1のデータベースに登録する過程と、前記Webページ集合について推定したトップページと、それにリンクしたページからサイト単位の木構造を推定してページ単位にこのページが属するサイトIDおよびこのサイトの木構造の深さ情報を第2のデータベースに登録する過程と、検索要求に対してヒットしたページのURLおよび単語の重みを反映したスコアを計算する過程と、前記ヒットしたページのURLから前記第2のデータベースを検索してこのページの所属するサイトIDおよびサイト木構造の深さ情報を取得する過程と、前記スコアと前記サイト木構造の深さ情報を基に前記検索要求に対する適合度を表す得点を計算する過程と、ヒットサイトリストに前記ページが所属するサイトIDが登録されていない場合にはこのサイトIDを登録し、前記計算した得点を前記サイトIDの得点要素として設定するか、もしくは既にこのサイトIDが登録されている場合には前記計算した得点をこのサイトIDの得点要素に加算する過程と、前記ヒットしたページにより生成されたヒットサイトリストを前記得点要素の値でソートして上位M件のサイトからなるリストを出力する過程と、前記M件のサイトIDから前記第1のデータベースを検索してこのサイトIDのURLを取得し、サイトIDとそのURLの組からなる検索結果を生成し、出力する過程とを、有する、ことを特徴とするWebサイト検索方法。
IPC (3):
G06F 17/30 340
, G06F 17/30 170
, G06F 17/30 370
FI (3):
G06F 17/30 340 A
, G06F 17/30 170 Z
, G06F 17/30 370 Z
F-Term (7):
5B075ND20
, 5B075ND34
, 5B075PQ02
, 5B075PQ27
, 5B075PQ32
, 5B075PQ38
, 5B075UU40
Return to Previous Page