Pat
J-GLOBAL ID:201003041161695631
トピックグラフを利用したドキュメント検索サーバ及び方法
Inventor:
Applicant, Patent owner:
Agent (1):
正林 真之
Gazette classification:公開公報
Application number (International application number):2008292728
Publication number (International publication number):2010118021
Application date: Nov. 14, 2008
Publication date: May. 27, 2010
Summary:
【課題】ユーザが検索のために入力したクエリに基づいて、ユーザの検索意図を推測し、クエリの意味に追従し、話題となっているドキュメントをレコメンドするサーバ及び方法を提供すること。【解決手段】ドキュメント検索サーバ10は、蓄積されたクエリを構成する複数のトークンのそれぞれの間にユーザの入力順序に基づいた有向リンクを設定すると共に、同一のトークンを統合することによりトピックグラフを作成し、トピックグラフに基づいてクエリログDB20に蓄積したトークンのトピック度を算出し、算出したトピック度が所定の閾値より高いトークンであるソーストークンを抽出し、抽出したソーストークンを含むクエリをクエリログDB20から抽出し、抽出したクエリをクラスタリングしてトピッククラスタを作成し、受け付けたクエリに対応するトピッククラスタに属するクエリで高頻度に選択されているドキュメントをレコメンドする。【選択図】図1
Claim (excerpt):
ユーザから受け付けたクエリに基づいてドキュメントを検索するドキュメント検索サーバであって、
複数のユーザから受け付けた前記クエリを蓄積するクエリログ蓄積手段と、
前記クエリにより検索されたドキュメントのうち前記ユーザによって選択されたドキュメントを当該クエリに対応付けて蓄積するクリックログ蓄積手段と、
前記クエリログ蓄積手段に蓄積された前記クエリを構成する複数のトークンのそれぞれの間に前記ユーザの入力順序に基づいた有向リンクを設定すると共に、同一のトークンを統合することによりトピックグラフを作成するトピックグラフ作成手段と、
前記トピックグラフに基づいてクエリログ蓄積手段に蓄積したトークンのトピック度を算出するトピック度算出手段と、
前記算出したトピック度が所定の閾値より高いトークンであるソーストークンを抽出するソーストークン抽出手段と、
前記抽出したソーストークンを含むクエリを前記クエリログ蓄積手段から抽出し、抽出したクエリをクラスタリングしてトピッククラスタを作成するトピッククラスタ作成手段と、
前記ドキュメントの検索時に受け付けたクエリに対応するトピッククラスタに基づいて、トピッククラスタ内に属するクエリで検索され選択されているドキュメントの内で高頻度に前記選択されているドキュメントを前記クリックログ蓄積手段に基づいて選択してレコメンドするレコメンド手段と、
を備えることを特徴とするドキュメント検索サーバ。
IPC (1):
FI (3):
G06F17/30 340A
, G06F17/30 170A
, G06F17/30 210D
F-Term (4):
5B075KK02
, 5B075ND36
, 5B075NR12
, 5B075PR08
Patent cited by the Patent:
Cited by applicant (1)
-
話題抽出装置
Gazette classification:公開公報
Application number:特願2002-072968
Applicant:富士通株式会社
Return to Previous Page