特許
J-GLOBAL ID:200903072783786156

構造化文書検索方法及び装置

発明者:
出願人/特許権者:
代理人 (1件): 笹岡 茂 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平6-308201
公開番号(公開出願番号):特開平8-147311
出願日: 1994年11月17日
公開日(公表日): 1996年06月07日
要約:
【要約】【目的】 実用規模の構造化文書データベースを対象として構造を指定した検索が行われた場合でも、実用上許容しうる十分な検索時間で検索結果を得る。【構成】 登録時に、登録対象文書本文を検索用データベースに登録し、該登録文書の論理構造を識別しこれを論理構造毎に分割し、夫々論理構造毎に単語を単位として本文を情報圧縮して論理構造別凝縮本文を作成・登録し、該登録文書中に現われる全ての文字を重複なく集めた文字成分表を作成・登録し、検索時に、文字成分表を参照し、指定された検索条件式中の検索タームを構成する全ての文字が含まれる文書だけを抽出する文字成分表サーチを行ない、抽出文書に対し、検索対象に指定された論理構造凝縮本文中に上記検索タームが含まれる文書を抽出する論理構造別凝縮本文サーチを行ない、抽出文書に対して、上記検索条件式の条件によっては、本文サーチを行なう。図は検索処理例を示す。
請求項(抜粋):
本文が複数の論理構造で構成される構造化文書に対して、目的とする論理構造を対象とした検索を行う構造化文書の検索方法において、登録時に、登録対象文書を検索用データベースに格納する本文登録ステップと、該登録文書に対して本文の論理構造を識別しこれを論理構造毎に分割するとともに、それぞれ論理構造毎に単語を単位として本文を情報圧縮して凝縮本文を作成、登録する論理構造別凝縮本文作成・登録ステップと、該登録文書中に現われる全ての文字を重複なく集めた文字成分表を作成、登録する文字成分表作成・登録ステップと、検索時に、前記文字成分表を参照し、指定された検索条件式中の検索タームを構成する全ての文字が含まれる文書だけを抽出する文字成分表サーチステップと、前記文字成分表サーチステップで抽出された文書に対し、各論理構造毎に作成した前記凝縮本文のうち検索対象に指定された論理構造に対応する凝縮本文中に、前記検索タームが含まれる文書を抽出する論理構造別凝縮本文サーチステップと、前記検索条件式として複数の検索タームの本文中での位置関係が指定された場合には、前記論理構造別凝縮本文サーチステップで抽出された文書に対し、その本文を参照し、前記複数の検索タームが含まれ、かつ該検索ターム間に付与された位置関係等の検索条件が満たされるもののみを抽出する本文サーチステップを有することを特徴とする構造化文書検索方法。
引用特許:
審査官引用 (3件)
  • 全文デ-タベ-ス検索方法
    公報種別:公開公報   出願番号:特願平5-091080   出願人:株式会社日立製作所
  • 特開平3-174652
  • 特開平3-174652

前のページに戻る