特許
J-GLOBAL ID:200903029568811368
データ記憶再生方法及びその装置
発明者:
,
出願人/特許権者:
代理人 (1件):
小鍜治 明 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平5-119728
公開番号(公開出願番号):特開平6-332947
出願日: 1993年05月21日
公開日(公表日): 1994年12月02日
要約:
【要約】【目的】 大量の文書データを蓄えた2次記憶装置から検索用のインデックス情報を付与することなしに要求された文書データを引き出してくる全文検索装置に関するもので、特に全文検索の本文を連想する内容番地記憶型の連想表をファイルの物理的連続性を保ち高速に効率良く生成管理すること。【構成】 予めファイルシステム1に2つ以上の予約領域を確保し、第1番目の領域には固定容量でエントリやフラグやポインタをおき第2の領域には可変容量で追加を容易にしている。
請求項(抜粋):
記憶装置に蓄えられた文書データを読み出し、適当な文書量毎に識別名称を付与し、かつその文書データの内容を調べ、文字iに連接する文字jの文字並びを抽出して内容番地記憶構造の表として書き込んでおき、この書き込みの際には、予め特定の文書に関し、文字iと連接する連接文字jの統計的出現情報を得て、単位文書あたりに出現する文字iと文字jの連接文字の組み合わせ数を予測して文字i毎の連接種類数に応じて確保した第1の領域に文字iに連接する文字種jを前記記憶ファイル装置の位置情報とともに記録する書き込み、文字連接の文字種類によらない別の第2の文字連接初期予約領域を確保しておき、もし最初に文字iについて確保されていた第1の初期予約領域を越えた場合はこの領域を廃棄ないしは移動して、第2の記録領域に文字種iに対応した予測記録領域を新たに確保して文字iに連接する文字種jを前記記憶ファイル装置の位置情報とともに記録し、第1の文字連接初期予約領域に文字連接が書き込まれているのか、また第2の初期予約領域の特定位置に文字連接が書き込まれているのかは、例えば第1の初期予約領域に識別符号を書いておき、最初に第1の初期予約領域を読みとり、次に検索要求者から出された検索文字列(例えば検索単語)とそれらの検索論理式を受け付け、それら検索文字列を調べて文字並びの文字iを先頭とし、引き続く文字jがどのようなものであるかを知って先ほどの第1の初期予約領域、次にもし識別符号が存在すればポインタに従って第2の初期予約領域を読んで、文字jが含まれて検索文字列の連接文字並びがすべて含まれているもの(AND)の位置情報(識別名称)を持つ文書ファイルを検索候補として選び、記憶ファイル中の実際の記録場所を得て全文を検索するデータ記憶再生方法。
IPC (2件):
G06F 15/40 500
, G06F 12/00 520
前のページに戻る