特許
J-GLOBAL ID:200903015331293787
文書検索方法及び装置
発明者:
出願人/特許権者:
代理人 (1件):
上野 英夫
公報種別:公開公報
出願番号(国際出願番号):特願2002-057774
公開番号(公開出願番号):特開2002-328947
出願日: 2002年03月04日
公開日(公表日): 2002年11月15日
要約:
【要約】【課題】指定された検索質問に適合する文書や情報を見つけ出し、ユーザに呈示する情報検索方法において、一般的にブーリアンモデルとベクトル空間モデルがよく知られている。しかしブーリアンモデルは、各索引語に対しての重み付けはできず、また、検索結果を適合度の順番に従って並べ替えることもできない。拡張ブーリアンモデルでは、これらの問題は解消されているが、検索結果のフィードバックができないという問題が残っている。一方、ベクトル空間モデルでは、 AND、ORなどの索引語間の関係の記述能力に問題がある。【解決手段】本願は発明では、ブーリアンモデルによって入力されたN個の検索質問をN次元の複数のベクトルに展開し、検索されるべき文書が検索質問と適合するか否かの判断を、文書から求められるベクトルと、検索質問から展開されたベクトルとの照合によって解決する。
請求項(抜粋):
所与の論理形式の検索質問をベクトル形式に変換し、文書集合の中から前記検索質問に適した文書を検索する方法であって、(a)前記検索質問に含まれる各索引語の有無を成分とするベクトルであって、前記検索質問と適合する文書がとりうるあらゆるベクトルとして前記検索質問から生成される第1の索引語ベクトルをもとに平方和行列を算出するステップと、(b)前記平方和行列の固有ベクトルおよび固有値を算出するステップと、(c)前記固有ベクトルから、部分空間を構成する基底ベクトルを選択するステップと、(d)前記検索質問に含まれる各索引語の有無を成分とし、各前記文書から生成される第2の索引語ベクトルと前記各基底ベクトルとの内積および前記固有値を用いた重み付け係数をもとに前記文書と前記検索質問との第1の類似度を求めるステップと、(e)前記第1の類似度と所与の閾値とを比較し、各前記文書が前記検索質問と適合するか否かを判定するステップとを含む文書検索方法。
IPC (2件):
G06F 17/30 350
, G06F 17/30 170
FI (2件):
G06F 17/30 350 C
, G06F 17/30 170 A
Fターム (4件):
5B075ND03
, 5B075PP24
, 5B075PP26
, 5B075UU06
引用特許:
審査官引用 (1件)
-
情報検索方法及び情報検索装置
公報種別:公開公報
出願番号:特願平11-040123
出願人:技術研究組合新情報処理開発機構, 株式会社東芝
前のページに戻る