特許
J-GLOBAL ID:200903058549551436

インデクス生成装置及び文書検索装置

発明者:
出願人/特許権者:
代理人 (1件): 青山 葆 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願2000-133437
公開番号(公開出願番号):特開2001-312517
出願日: 2000年05月02日
公開日(公表日): 2001年11月09日
要約:
【要約】【課題】 文書データベースのインデクスデータファイルの容量を圧縮する。【解決手段】 文書データベースに格納されている文書から文字列を抽出し、その文字列に係る文書番号と、その文書の各々における出現位置を求め、それら文書番号又はそれら出現位置、若しくはその両方において、差分データ化して記録しインデクスとする。
請求項(抜粋):
文書データベースに格納されている複数又は1つの文書から、任意の文字列を内部に含む文書を検索する際に用いるインデクス・データを生成する装置において、上記文書データベースに格納される文書から複数の部分文字列を抽出する文字列抽出手段と、上記の抽出された部分文字列の個々において、上記の抽出された部分文字列が出現する文書の識別番号を抽出する出現文書抽出手段と、上記の抽出された部分文字列の個々において、上記の出現文書抽出手段により抽出された1つ又は複数の文書識別番号を数値配列とし、その数値配列を差分値による表現形態に変換し、その差分値で表現される数値配列をバイナリ表記の可変長データとして記録してインデクスを構成する第1のデータとする、出現文書差分記録手段と、上記の抽出された部分文字列が出現する各文書においてその文書における出現位置を上記の第1のデータと関連させて記録してインデクスを構成する第2のデータとする、出現位置記録手段とを備える、インデクス生成装置。
IPC (3件):
G06F 17/30 414 ,  G06F 17/30 170 ,  G06F 17/30 210
FI (3件):
G06F 17/30 414 Z ,  G06F 17/30 170 A ,  G06F 17/30 210 Z
Fターム (3件):
5B075ND03 ,  5B075NK10 ,  5B075UU06

前のページに戻る