特許
J-GLOBAL ID:201203045510480451

ランキングモデル選択機能を有する文書検索装置、ランキングモデル選択機能を有する文書検索方法およびランキングモデル選択機能を有する文書検索プログラム

発明者:
出願人/特許権者:
代理人 (4件): 小林 博通 ,  鵜澤 英久 ,  山口 幸二 ,  橋本 剛
公報種別:公開公報
出願番号(国際出願番号):特願2011-032317
公開番号(公開出願番号):特開2012-173794
出願日: 2011年02月17日
公開日(公表日): 2012年09月10日
要約:
【課題】入力クエリに対して最適なランキングモデルを選択することができるランキングモデル選択機能を有する文書検索装置を提供する。【解決手段】クエリ間の検索評価指標値(MAP値)から、クエリ間の類似度が高くなる変換行列を作成し、最大類似度を持つクエリのランキングモデルを、クエリに対する最適モデルとして最適モデルDB106に格納しておく。入力された検索クエリに対応する最適モデルを前記DB106から取得し、該最適モデルのクエリに対応する、ランキングモデルDB103内のスコア要因重みと、クエリ処理部150により算出された、検索結果集合とスコア要因を要素とするスコア要因値行列とを検索スコア計算部160で積算し、該算出された検索スコアの降順に入力検索クエリに対応する検索結果を提示する。【選択図】図1
請求項(抜粋):
N個のクエリ各々に対してM次元の特徴で表現したクエリ表現データが格納されたクエリ表現データベースと、 N個のクエリに対する文書の検索結果の適合度と、M次元のベクトルで表される特徴表現とを有した訓練データが格納された訓練データデータベースと、 前記訓練データを入力とし、各クエリの前記特徴表現に対する重みを保持したランキングモデルを生成してランキングモデルデータベースを構築するランキング関数生成手段と、 前記訓練データおよびランキングモデルを入力とし、前記ランキングモデルデータベース内の全モデルに対して最大の検索評価指標値を与えて、訓練データにおける最高精度を示す訓練時最適ランキングモデルを生成し、該訓練時最適ランキングモデルのクエリと前記訓練データのクエリの対のデータを有した訓練時最適モデルデータベースを構築する訓練時最適モデル選択手段と、 前記クエリ表現データベースと訓練時最適モデルデータベースの各データを入力とし、クエリ表現データベース内のクエリと、該クエリに相当する前記訓練時最適モデルデータベース内の訓練時最適ランキングモデルのクエリとの距離が最小となる変換行列を学習して生成し、変換行列データベースを構築する距離学習手段と、 前記クエリ表現データベース、ランキングモデルデータベースおよび変換行列データベースの各データを入力とし、クエリ表現データベース内の各クエリについて、前記変換行列を利用して各クエリ間の類似度を計算し、最大の類似度を持つクエリを選択し、該選択されたクエリのランキングモデルを前記ランキングモデルデータベースから取得し、該取得されたランキングモデルをクエリに対する最適モデルとして最適モデルデータベースを構築する最適モデルデータベース作成手段と、 予めWebページから収集した文書を基に作成された文書インデクスが格納された文書インデクスデータベースと、 入力された検索クエリに対する検索結果集合を前記文書インデクスデータベースから取得し、該検索結果集合と複数のスコア要因とでスコア要因値行列を算出するクエリ処理手段と、 前記クエリ処理手段で算出されたスコア要因値行列と、前記ランキングモデルデータベースおよび最適モデルデータベースの各データとを入力とし、前記入力された検索クエリに対応する最適モデルを前記最適モデルデータベースから取得し、該取得された最適モデルのクエリに対応する前記ランキングモデルデータベース内のランキングモデルとしての重みと、前記スコア要因値行列とを積算して検索スコアベクトルを計算する検索スコア計算手段と、 前記検索スコア計算手段により計算された検索スコアの降順に入力クエリに対する検索結果を提示する検索結果提示手段と、 を備えたことを特徴とするランキングモデル選択機能を有する文書検索装置。
IPC (1件):
G06F 17/30
FI (3件):
G06F17/30 350C ,  G06F17/30 170A ,  G06F17/30 220Z
Fターム (3件):
5B075ND03 ,  5B075PQ75 ,  5B075QM08

前のページに戻る