特許
J-GLOBAL ID:200903080201068427
文書検索方式
発明者:
出願人/特許権者:
公報種別:公開公報
出願番号(国際出願番号):特願平5-096615
公開番号(公開出願番号):特開平6-290217
出願日: 1993年03月31日
公開日(公表日): 1994年10月18日
要約:
【要約】【目的】 文字列による文書検索において、1バイト並びに2バイトの文字コードからなる長い文書にあっても適合率が落ちないようにして、高速な文書検索を可能とする。【構成】 対象文書は、1バイト文字コードと2バイト文字コードとからなるテキストデータとし、1バイト文字コードを2バイト文字コードへマッピングして扱う。文書を登録するときは、文書をある一定サイズで分割し、分割した文書のそれぞれに対して文字成分表を別のエントリとして登録する。文書登録時に、単一文字成分及び文字種毎に異なる隣接文字成分を抽出し、各文字成分表に加える。検索時には、登録時と同様に検索文字列から単一文字成分と隣接文字成分を抽出し、それぞれ文字成分表から各文字成分を含む文書を検索し、文書を一致度とともに表示する。
請求項(抜粋):
大量の文書データを保持し、入力装置から入力された検索文字列を含む文書を検索し、出力装置により検索した文書を出力する文書検索装置において、文書登録時に文書より各文字コード成分である単一文字成分及び隣接文字から抽出したビット列成分である隣接文字成分を抽出する抽出手段と、各文書がそれぞれの成分を含むか否かを示す単一文字成分表及び隣接文字成分表を生成する文字成分生成手段と、検索時には検索文字列から同様に単一文字成分及び隣接文字成分を抽出してこれらの成分により各文字成分表から文書を検索する検索手段とからなり、文書中及び検索文字列中の文字が1バイト文字コードの場合2バイト文字コードにマップし、1バイト文字コードを2バイト文字コードとして登録及び検索することによって、1バイト文字コードを含んだ文書及び検索文字列も扱えるようにしたことを特徴とする文書検索方式。
IPC (3件):
G06F 15/40 500
, G06F 15/20 520
, G06F 15/20 522
引用特許:
前のページに戻る