特許
J-GLOBAL ID:200903066109861800

文書検索装置および記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 服部 毅巖
公報種別:公開公報
出願番号(国際出願番号):特願平10-027453
公開番号(公開出願番号):特開平11-224264
出願日: 1998年02月09日
公開日(公表日): 1999年08月17日
要約:
【要約】【課題】 検索式に該当する文書を検索する場合の検索漏れと検索ノイズとを低減させる。【解決手段】 入力検索語変換手段1は、入力された検索式に含まれている複合語を抽出し、その複合語を構成する単語を列記した単語リストに変換して出力する。単語検索手段3は、単語索引格納手段2に格納されている単語の索引を参照して、入力検索語変換手段1から供給された単語に対応する文書の文書ポインタを取得する。論理積演算手段4は、単語検索手段3から供給された文書ポインタの論理積を演算して、検索結果の文書群を算出する。複合語検索手段6は、複合語索引格納手段5に格納されている複合語の索引を参照して、検索式に含まれている複合語を含む文書の文書ポインタを取得する。文書スコアリング手段7は、論理積演算手段4によって得られた文書ポインタをスコアリングする。検索結果提示手段9は、文書情報格納手段8に格納されている文書情報をスコアリングの結果に応じて提示する。
請求項(抜粋):
1つの検索語あるいは論理積演算子によって結合された複数の検索語により構成される検索式が入力され、その検索式に対応する文書を検索する文書検索装置において、検索の対象となる文書集合に関する情報を格納する文書情報格納手段と、検索対象となる文書集合に含まれている単語の索引を格納する単語索引格納手段と、検索対象となる文書集合に含まれている複合語の索引を格納する複合語索引格納手段と、前記検索式を構成する検索語を抽出し、注目する検索語が複合語である場合にはその複合語を、それを構成する単語のリストに変換し、また、複合語ではない場合にはその検索語をそのまま出力する入力検索語変換手段と、前記入力検索語変換手段によって得られた各単語、または、単語リストを構成する各単語をそれぞれ含む文書を、前記単語索引格納手段を参照して検索する単語検索手段と、前記単語検索手段によって得られた各単語を含む文書集合の間で論理積演算を実行し、検索結果の文書集合を求める論理積演算手段と、前記検索式に含まれている複合語を含む文書を、前記複合語索引格納手段を参照して検索する複合語検索手段と、前記論理積演算手段によって得られた検索結果の文書集合のそれぞれの文書に対して、前記複合語検索手段の検索結果に応じてスコアリングする文書スコアリング手段と、前記文書スコアリング手段のスコアリング結果に応じて、前記論理積演算手段の演算によって得られた文書集合に対応する前記文書情報の提示形式を変更する検索結果提示手段と、を有することを特徴とする文書検索装置。
FI (4件):
G06F 15/403 330 B ,  G06F 15/403 340 C ,  G06F 15/403 370 Z ,  G06F 15/403 380 Z
引用特許:
出願人引用 (3件)
  • 特開平3-286371
  • 情報検索装置
    公報種別:公開公報   出願番号:特願平7-202747   出願人:富士ゼロックス株式会社
  • 情報検索装置
    公報種別:公開公報   出願番号:特願平4-120841   出願人:富士通株式会社
審査官引用 (3件)
  • 特開平3-286371
  • 情報検索装置
    公報種別:公開公報   出願番号:特願平7-202747   出願人:富士ゼロックス株式会社
  • 情報検索装置
    公報種別:公開公報   出願番号:特願平4-120841   出願人:富士通株式会社

前のページに戻る