特許
J-GLOBAL ID:200903032467678560
全体の精度を高めるためにサーチ結果の自然言語処理を用いる情報検索システムのための装置および方法
発明者:
,
,
,
出願人/特許権者:
代理人 (1件):
深見 久郎 (外5名)
公報種別:公表公報
出願番号(国際出願番号):特願2000-504525
公開番号(公開出願番号):特表2001-511564
出願日: 1998年05月13日
公開日(公表日): 2001年08月14日
要約:
【要約】全体の精度を高めるために、たとえば従来の統計に基づくサーチエンジンのような情報検索エンジンによって検索された結果を処理するために自然言語処理を利用する情報検索システムのための装置およびそれに付随する方法を提供する。具体的には、このようなサーチは最終的に検索されたドキュメントの集合を生む。このような各ドキュメントは次に自然言語処理を受けて論理形式の集合を生じる。このような各論理形式は句内の語間の意味的関係、特に主題と修飾語句との構造を語-関係子-語の態様で符号化する。ユーザが与えるクエリも同様に分析されてそのための対応の論理形式の集合を生み出す。ドキュメントはドキュメントおよびクエリからの論理形式の予め規定された関数としてランク付けされる。具体的には、クエリのための論理形式の集合は、検索されたドキュメントの各々のための論理形式の集合と比較されて両方の集合内のこのような任意の論理形式間の一致を確認する。少なくとも1つの一致する論理形式を有する各ドキュメントがヒューリスティックにスコア付けされ、一致する論理形式のための異なる各関係が異なる対応の予め定められた重みを割当てられる。このような各ドキュメントのスコアはたとえば、その独自に一致する論理形式の重みの予め規定された関数である。最後に、保持されたドキュメントがスコアの高い順にランク付けされてその順でユーザに提示される。
請求項(抜粋):
記憶されているドキュメントをリポジトリから検索するための情報検索システムにおいて用いるための装置であって、前記システムは、クエリに応答してそのクエリに関連した複数の記憶されているドキュメントを検索し、出力ドキュメント集合を規定するための検索システムを有し、前記装置は、 プロセッサと、 実行可能な命令が記憶されているメモリとを含み、 プロセッサはメモリに記憶されている命令に応答して、 クエリに応答してそのための第1の論理形式を生じ、第1の論理形式はクエリに関連した語の間の意味的関係を示し、 出力ドキュメント集合内のドキュメントの各別の1つに対して、対応する第2の論理形式を取得し、第2の論理形式は前記1つのドキュメント内の句に関連した語の間の意味的関係を示し、 クエリの第1の論理形式と、出力ドキュメント集合内の複数のドキュメントの各1つのための第2の論理形式との予め定義された関数として、出力ドキュメント集合内の複数のドキュメントをランク付けしてランク順を規定し、 出力ドキュメント集合に関連した複数の記憶されているエントリを前記ランク順に出力として与える、装置。
FI (2件):
G06F 15/403 330 C
, G06F 15/40 310 F
Fターム (2件):
引用特許: