特許
J-GLOBAL ID:200903010922282146

文書検索装置

発明者:
出願人/特許権者:
代理人 (1件): 高野 明近
公報種別:公開公報
出願番号(国際出願番号):特願平5-298433
公開番号(公開出願番号):特開平7-160724
出願日: 1993年11月29日
公開日(公表日): 1995年06月23日
要約:
【要約】【目的】 文字列成分表を利用することで、頻繁に検索する検索語について誤検索を含まない検索を可能とする。【構成】 入力部1に入力された検索文字列は、処理部2の文字列入力処理部3で処理する。文書検索処理部4においてデータ部7の文字成分表8を利用し、文字列を含むと思われる文書を検索する。検索した文書に対応する文書データ10を文書出力処理5により出力部9に出力する。文書登録処理部6では、登録する文書を文書データ10に登録し、該文書データ10より文字成分を抽出して文字成分表8に登録する。ユーザの検索語の頻度情報を蓄積し、頻度の高い検索語については、文字成分表8とは別に文字列がどの文書に存在するか否かを示す文字列成分表12に登録し、該文字列成分表12に登録された単語の検索については誤検索のない検索を可能とする。
請求項(抜粋):
大量の文書データを保持し、入力装置から入力された検索文字列を含む文書を検索し、出力装置により検索した文書を出力する文書検索装置において、文書登録時に文書より各文字コード成分及び隣接文字から抽出したビット列成分を抽出する第1の抽出手段と、各文書がそれぞれの成分を含むか否かを示す単一文字成分表及び隣接文字成分表を生成する生成手段と、検索時には検索文字列から同様に単一文字成分及び隣接文字成分を抽出する第2の抽出手段と、これらの成分により各文字成分表から文書を検索する検索手段と、検索語の頻度情報を蓄積して頻度の高い検索語については、前記文字成分表とは別に文字列がどの文書に存在するか否かを示す文字列成分表に登録する登録手段とを有し、前記文字列成分表に登録された単語の検索については誤検索のない検索を可能とすることを特徴とする文書検索装置。
IPC (2件):
G06F 17/30 ,  G06F 17/21
FI (4件):
G06F 15/40 370 A ,  G06F 15/20 563 A ,  G06F 15/20 590 E ,  G06F 15/403 340 B

前のページに戻る