特許
J-GLOBAL ID:200903045835023655

文書登録方法と文書検索方法及びその実施装置並びにその処理プログラムを記録した媒体

発明者:
出願人/特許権者:
代理人 (1件): 秋田 収喜
公報種別:公開公報
出願番号(国際出願番号):特願平10-163901
公開番号(公開出願番号):特開2000-003366
出願日: 1998年06月11日
公開日(公表日): 2000年01月07日
要約:
【要約】【課題】 目的とする論理構造だけを対象に指定する構造指定検索を高速に実現することが可能な技術を提供する。【解決手段】 登録対象文書における論理構造定義情報またはインデックスグループ定義情報により、検索時に一括して参照される可能性の高い文字列データの組に所定のインデックスグループ識別子を付与し、登録対象文書中に出現した文字列データにインデックスグループ識別子を付与し、メタ要素群及びメタ文字列群の木構造から構成される構造インデックスを生成し、登録対象文書中に出現した各論理構造に属する文字列データに対して、前記構造インデックスの文脈識別子とインデックスグループ識別子を対応付け、当該文字列データの文書識別子、文脈識別子及び構造化文字位置情報をインデックスグループ識別子毎に蓄積、管理するものである。
請求項(抜粋):
1件の文書が複数の論理構造で構成される構造化文書を登録する文書登録方法において、登録対象文書における論理構造定義情報またはインデックスグループ定義情報により、検索時に一括して参照される可能性の高い文字列データの組に所定のインデックスグループ識別子を付与した論理構造管理テーブルを作成する論理構造管理テーブル生成登録ステップと、該論理構造管理テーブルを参照しながら登録対象文書の持つ論理構造を解析し、該登録対象文書中に出現した文字列データにインデックスグループ識別子を付与した解析済みデータを生成するインデックスグループ識別子付加型解析済みデータ生成ステップと、該インデックスグループ識別子付加型解析済みデータを入力として、メタ要素群及びメタ文字列群の木構造から構成される構造インデックスを生成し、該構造インデックスを構成するメタノードを構造インデックス内で一意に識別する識別子である文脈識別子を付与する構造インデックス生成ステップと、該インデックスグループ識別子付加型解析済みデータと構造インデックスを入力として、該登録対象文書中に出現した各論理構造に属する文字列データに対して、文脈識別子とインデックスグループ識別子を対応付けて構成したインデックスグループ識別子付加型の構造化全文データを生成するインデックスグループ識別子付加型構造化全文データ生成ステップと、該インデックスグループ識別子付加型構造化全文データにおける文字列データから所定の部分文字列を抽出し、前記登録対象文書を文書データベースにおいて一意に識別する為の文書識別子と、前記部分文字列に対応する論理構造の文脈識別子と、該登録対象文書中での文字位置情報を組とした構造化文字位置情報を生成し、これを各部分文字列に関する論理構造のインデックスグループ識別子毎に蓄積、管理することにより、構造指定検索用の文字列インデックスを生成する文字列インデックス生成ステップとを有することを特徴とする文書登録方法。
FI (4件):
G06F 15/401 310 D ,  G06F 15/40 340 ,  G06F 15/40 370 A ,  G06F 15/413 310 A
Fターム (8件):
5B075ND03 ,  5B075ND35 ,  5B075NK02 ,  5B075NK22 ,  5B075NK43 ,  5B075NR06 ,  5B075NR12 ,  5B075UU06

前のページに戻る