特許
J-GLOBAL ID:200903017821535609

文書検索システム

発明者:
出願人/特許権者:
代理人 (1件): 役 昌明 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平8-156419
公開番号(公開出願番号):特開平9-319766
出願日: 1996年05月29日
公開日(公表日): 1997年12月12日
要約:
【要約】【課題】 利用者から、辞書に登録されていない文字列(未知語)を含む質問文で質問された場合でも、当該文字列を含む文書を漏れなく検索し、かつ精度を落すことなく文書と質問文との類似度を効率的に計算することを可能にし、非完全一致モデルに基づく文書検索の検索精度および効率の向上を図る。【解決手段】 類似度判定手段1605は、利用者からの入力文字列が単語である場合には単語統計情報格納手段1604に予め収集された当該単語の統計情報を利用し、当該入力文字列が単語でない場合は全文検索手段1606を用いて動的に統計情報を求めて各文書と入力意図との類似度を計算する。また、辞書変更手段1611は入力履歴格納手段1608と言語情報格納手段1610に格納された情報を用いて辞書1602を適宜変更した上で、単語統計情報収集手段1603にて単語統計情報の再収集を行なう。
請求項(抜粋):
単語集合を規定する辞書と、検索対象文書を格納する文書格納手段と、前記文書格納手段から検索対象文書を読み出して各文書中の各単語の頻度情報や、全検索対象文書での各単語の分布情報などの単語統計情報を収集する単語統計情報収集手段と、前記単語統計情報収集手段で収集した単語統計情報を格納する単語統計情報格納手段と、利用者からの入力と、前記単語統計情報格納手段内の単語統計情報とを参照して利用者の検索意図と各文書との類似度を判定する類似度判定手段とを備え、前記類似度判定手段において、利用者からの入力と収集された各文書の単語統計情報との適合度に基づいて、各検索対象文書の利用者の検索意図に類似する順位を決定する文書検索システムにおいて、更に、利用者が入力した任意の文字列について、それが検索対象文書中のどの文書に出現するかということを検索することのできる全文検索手段を設け、前記全文検索手段により利用者が入力した各文字列について全文検索を行なった後に、前記類似度判定手段は、その検索結果の各文書について、前記単語統計情報格納手段に格納されている予め収集された単語統計情報を参照して、前記入力文との適合度を計算して利用者の検索意図との類似順位を決定するようにしたことを特徴とする文書検索システム。
IPC (2件):
G06F 17/30 ,  G06F 17/21
FI (4件):
G06F 15/403 340 C ,  G06F 15/20 570 N ,  G06F 15/40 370 A ,  G06F 15/403 350 A
引用特許:
出願人引用 (1件)
  • 特開平2-125363

前のページに戻る