特許
J-GLOBAL ID:200903040195256141

文書検索方法および装置

発明者:
出願人/特許権者:
代理人 (1件): 笹岡 茂 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平7-019673
公開番号(公開出願番号):特開平8-194718
出願日: 1995年01月12日
公開日(公表日): 1996年07月30日
要約:
【要約】【目的】 フルテキストサーチにおいて、文字数が多く、かつ出現頻度が高い文字列で構成される検索タームが入力された場合でも、高速な検索を実現する。【構成】 テキストから抽出した所定の部分文字列に対して該部分文字列のテキスト中での文字位置を示す文字位置情報とテキスト番号からなる位置情報を作成し、部分文字列を文字列管理用の文字列テーブルに登録し、該テーブル中の部分文字列に付されたポインタが示す格納位置に位置情報を格納してインデックス(IX)を作成し、IXのサイズと基準IXサイズを比較し、IXのサイズが大のときは、IXに対応する部分文字列に1文字を追加した拡張部分文字列に対するIXを作成する。検索時は、検索タームから所定の部分文字列を抽出し、文字列テーブルを参照して一致する部分文字列に対応するIXを読み出し、検索タームにおける部分文字列と同じ位置関係を持つ位置情報を抽出し、検索を行なう。
請求項(抜粋):
文書情報を文字コードデータとして蓄積したテキストデータベースを対象として、対象テキストデータから所定の部分文字列と、該部分文字列の対象テキストデータにおける文字位置情報及びテキスト指定情報を含む位置情報を抽出し、該位置情報をインデックスとして記憶し、前記部分文字列と前記インデックスの記憶位置を管理するための文字列テーブルを更新するインデックス作成登録ステップと、検索タームから所定の部分文字列を抽出し、前記文字列テーブルを参照して該当インデックスを読み出し、該検索タームにおける部分文字列と同じ位置関係を持つ位置情報を抽出するインデックス検索ステップを有する文書検索方法において、テキストデータから作成した部分文字列に対応するインデックスのサイズと予め定められた基準インデックスサイズとを比較するインデックスサイズ比較ステップと、該インデックスのサイズが該基準インデックスサイズより大きい場合には、該インデックスに対応する部分文字列に1文字を追加した拡張部分文字列と該拡張部分文字列に対応するインデックスを作成する文字列インクリメントステップを有することを特徴とする文書検索方法。
FI (3件):
G06F 15/40 370 A ,  G06F 15/403 320 C ,  G06F 15/403 350 A
引用特許:
出願人引用 (1件)

前のページに戻る