特許
J-GLOBAL ID:200903036719605001

類似ウェブページ探索方法、装置及びそのプログラム並びにそれを記録した情報記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 吉田 精孝
公報種別:公開公報
出願番号(国際出願番号):特願2001-277997
公開番号(公開出願番号):特開2003-085202
出願日: 2001年09月13日
公開日(公表日): 2003年03月20日
要約:
【要約】【課題】 ユーザのアクセス履歴を利用してサイト候補を絞り込むことにより有益な類似ウェブページを検出する類似ウェブページ探索方法、装置及びそのプログラム並びにそれを記録した情報記録媒体を提供する。【解決手段】 アクセスログ蓄積部11に蓄積されているアクセス履歴から、ウェブページのURL情報Rと、このウェブページに埋め込まれているリンク先のURL情報Tとラベルの文字列Lの中の名詞部分Nを抽出して、{R,T,N}を1組のアクセス履歴情報として複数のアクセス履歴情報をアクセス履歴情報記憶部13に蓄積しておき、ユーザが任意のウェブページ{Ru,Tu,Nu}をアクセスしたときに、蓄積されているアクセス履歴情報の中から{Ru,Tu,Nu}の{Tu}項と{Nu}項のうちの少なくとも{Nu}項が同一であるアクセス履歴情報を抽出して類似ウェブページとする。
請求項(抜粋):
インターネット上に公開されているウェブページの掲載内容に類似した内容を掲載している他のウェブページのURLを探索する類似ウェブページ探索方法であって、ユーザがアクセスしたウェブページのURL情報(R)、及び該ウェブページに埋め込まれているリンク先のURL情報(T)とラベルの文字列(L)を取得し、前記ラベルの文字列(L)から名詞部分(N)を抽出して、前記{R,T,N}を1組のアクセス履歴情報として複数のアクセス履歴情報を蓄積しておき、ユーザがアクセスしているウェブページのアクセス履歴情報{Ru,Tu,Nu}を取得して、前記蓄積されているアクセス履歴情報の中から前記アクセス履歴情報{Ru,Tu,Nu}の{Tu}項と{Nu}項のうちの少なくとも{Nu}項が同一であるアクセス履歴情報を抽出し、該抽出したアクセス履歴情報に基づくウェブページを前記ユーザがアクセスしているウェブページの掲載内容に類似した内容を掲載している他のウェブページとすることを特徴とする類似ウェブページ探索方法。
IPC (4件):
G06F 17/30 340 ,  G06F 17/30 110 ,  G06F 17/30 170 ,  G06F 17/30 419
FI (4件):
G06F 17/30 340 A ,  G06F 17/30 110 F ,  G06F 17/30 170 Z ,  G06F 17/30 419 B
Fターム (5件):
5B075KK07 ,  5B075ND20 ,  5B075PR03 ,  5B075PR08 ,  5B075UU40

前のページに戻る