特許
J-GLOBAL ID:200903009417859880

文書検索装置

発明者:
出願人/特許権者:
代理人 (1件): 上村 輝之
公報種別:公開公報
出願番号(国際出願番号):特願平11-126319
公開番号(公開出願番号):特開2000-322416
出願日: 1999年05月06日
公開日(公表日): 2000年11月24日
要約:
【要約】【課題】 複数の単語が条件に指定された場合の文書検索を高速に行う。【解決手段】 検索エンジンの登録アルゴリズムは、登録対象となる文書を形態素解析器により単語に分解し、それぞれの単語の単語出現頻度TF及び文書出現頻度DFを集計する処理と、可変長文字列である登録単語を固定長数値に変換する処理と、各単語毎に文書IDとTFの組、日付とDFの組をインデックスに保存する処理とを有し、検索アルゴリズムは、検索条件に指定された単語を単語IDに変換する処理と、インデックスから単語IDに付いての文書IDとTF,DFを取得する処理と、インデックスから取得した各文書IDに付いてスコアを計算する処理と、文書IDをスコアの降順に並べ変える処理とを有する。
請求項(抜粋):
複数の登録文書に関して予め算出された、単語毎の単語出現頻度及び文書出現頻度をもっているインデックス情報と、検索条件として指定された1個以上の単語の単語出現頻度及び文書出現頻度を前記インデックス情報から取得し、取得した単語出現頻度及び文書出現頻度に基づいて、登録文書をランキングして検索結果として出力する検索手段と、を備えた文書検索装置。
FI (2件):
G06F 15/403 340 B ,  G06F 15/40 370 A
Fターム (13件):
5B075ND03 ,  5B075NK02 ,  5B075NK13 ,  5B075NK54 ,  5B075PP02 ,  5B075PP03 ,  5B075PP12 ,  5B075PP22 ,  5B075PQ02 ,  5B075PQ75 ,  5B075QP05 ,  5B075QS01 ,  5B075UU06
引用特許:
審査官引用 (5件)
  • 文書検索装置
    公報種別:公開公報   出願番号:特願平9-087328   出願人:松下電器産業株式会社
  • 文書登録検索システム
    公報種別:公開公報   出願番号:特願平6-136571   出願人:富士ゼロックス株式会社
  • 文書検索装置及び文書検索方法
    公報種別:公開公報   出願番号:特願平6-106406   出願人:株式会社東芝, 東芝コンピュータエンジニアリング株式会社
全件表示

前のページに戻る