特許
J-GLOBAL ID:201003041161695631
トピックグラフを利用したドキュメント検索サーバ及び方法
発明者:
出願人/特許権者:
代理人 (1件):
正林 真之
公報種別:公開公報
出願番号(国際出願番号):特願2008-292728
公開番号(公開出願番号):特開2010-118021
出願日: 2008年11月14日
公開日(公表日): 2010年05月27日
要約:
【課題】ユーザが検索のために入力したクエリに基づいて、ユーザの検索意図を推測し、クエリの意味に追従し、話題となっているドキュメントをレコメンドするサーバ及び方法を提供すること。【解決手段】ドキュメント検索サーバ10は、蓄積されたクエリを構成する複数のトークンのそれぞれの間にユーザの入力順序に基づいた有向リンクを設定すると共に、同一のトークンを統合することによりトピックグラフを作成し、トピックグラフに基づいてクエリログDB20に蓄積したトークンのトピック度を算出し、算出したトピック度が所定の閾値より高いトークンであるソーストークンを抽出し、抽出したソーストークンを含むクエリをクエリログDB20から抽出し、抽出したクエリをクラスタリングしてトピッククラスタを作成し、受け付けたクエリに対応するトピッククラスタに属するクエリで高頻度に選択されているドキュメントをレコメンドする。【選択図】図1
請求項(抜粋):
ユーザから受け付けたクエリに基づいてドキュメントを検索するドキュメント検索サーバであって、
複数のユーザから受け付けた前記クエリを蓄積するクエリログ蓄積手段と、
前記クエリにより検索されたドキュメントのうち前記ユーザによって選択されたドキュメントを当該クエリに対応付けて蓄積するクリックログ蓄積手段と、
前記クエリログ蓄積手段に蓄積された前記クエリを構成する複数のトークンのそれぞれの間に前記ユーザの入力順序に基づいた有向リンクを設定すると共に、同一のトークンを統合することによりトピックグラフを作成するトピックグラフ作成手段と、
前記トピックグラフに基づいてクエリログ蓄積手段に蓄積したトークンのトピック度を算出するトピック度算出手段と、
前記算出したトピック度が所定の閾値より高いトークンであるソーストークンを抽出するソーストークン抽出手段と、
前記抽出したソーストークンを含むクエリを前記クエリログ蓄積手段から抽出し、抽出したクエリをクラスタリングしてトピッククラスタを作成するトピッククラスタ作成手段と、
前記ドキュメントの検索時に受け付けたクエリに対応するトピッククラスタに基づいて、トピッククラスタ内に属するクエリで検索され選択されているドキュメントの内で高頻度に前記選択されているドキュメントを前記クリックログ蓄積手段に基づいて選択してレコメンドするレコメンド手段と、
を備えることを特徴とするドキュメント検索サーバ。
IPC (1件):
FI (3件):
G06F17/30 340A
, G06F17/30 170A
, G06F17/30 210D
Fターム (4件):
5B075KK02
, 5B075ND36
, 5B075NR12
, 5B075PR08
引用特許:
出願人引用 (1件)
-
話題抽出装置
公報種別:公開公報
出願番号:特願2002-072968
出願人:富士通株式会社
前のページに戻る