特許
J-GLOBAL ID:200903005407775144

全文データベースシステム

発明者:
出願人/特許権者:
代理人 (1件): 志賀 正武 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平5-204351
公開番号(公開出願番号):特開平7-056945
出願日: 1993年08月18日
公開日(公表日): 1995年03月03日
要約:
【要約】【目的】 インデックスファイルのサイズを小とし、十分な検索速度を得ることができる全文データベースシステムを提供する。【構成】 文書データを入力する入力装置2と、入力装置2から供給される文書データに基づいて、文字列長が2以上である固有疑似単語を有する和文最下層テーブルJ2-1および和文最上層テーブルJ2-2等を階層的に作成する構築処理装置3と、文書データおよび各テーブルJ2-1,J2-2等を実データファイルおよびインデックスファイルとして記憶する記憶装置4と、検索文字列を入力する入力装置6と、検索文字列を構成する文字列長が2となる検索用疑似単語に一致する固有疑似単語を上記インデックスファイルから抽出し、検索文字列に対応する文書データをディスプレイ9へ出力する検索処理装置7とから構成される。
請求項(抜粋):
階層構造を有するインデックステーブル群を用いて、検索文字列に一致する文字列を文書データから抽出する全文データベースシステムであって、前記文書データ中の各文字に連続するアドレスを付与するアドレス付与手段と、前記文書データ中の各文字と後続する文字とで構成される合計k文字(kは2以上)の疑似単語を作成し、各疑似単語の先頭文字列に付与される各アドレスを、対応する疑似単語の文字コード順にアドレステーブルへ記憶するアドレステーブル作成手段と、固有の文字コードを有する疑似単語を固有疑似単語として前記インデックステーブル群中の最下層テーブルへ文字コード順に記憶するとともに、各固有疑似単語に前記アドレステーブル中の各アドレスを対応付ける最下層構築手段と、前記インデックステーブル群中の最上層テーブルに記憶される固有疑似単語数が予め設定された数より大である場合、前記最上層テーブルを略均等に分割するように複数の固有疑似単語を抽出し、前記最上層テーブルの上層のテーブルへ前記複数の固有疑似単語を文字コード順に記憶する階層化手段とを具備することを特徴とする全文データベースシステム。
IPC (2件):
G06F 17/30 ,  G06F 12/00 520
FI (2件):
G06F 15/40 370 A ,  G06F 15/413 310 A
引用特許:
審査官引用 (2件)
  • 特開昭62-197822
  • 特開平3-118661

前のページに戻る