特許
J-GLOBAL ID:200903076320688894

構造化文書検索方法

発明者:
出願人/特許権者:
代理人 (1件): 小川 勝男
公報種別:公開公報
出願番号(国際出願番号):特願平6-147399
公開番号(公開出願番号):特開平8-016600
出願日: 1994年06月29日
公開日(公表日): 1996年01月19日
要約:
【要約】【目的】 検索対象に指定されていない論理構造に含まれるテキストを読み飛ばし照合処理の対象から外すことにより、実用上許容しうる十分な検索時間で検索結果が得られる高速な構造化文書検索方法を提供する。【構成】 文書のテキストに加えて、文書を構成する論理構造ごとの開始位置に構造識別子及びその論理構造長を付加した検索用データベースを検索して行く。前方マーカ判定ステップ40では、構造識別子を検出するとそれが検索対象に指定された論理構造を示す識別子か否か判定する。YESの場合は文字列照合ステップ50に移り、論理構造長分だけ検索を行ってテキストの文字列中に検索タームがあるか照合する。NOの場合は照合処理スキップステップ60に移り、論理構造長分だけ検索をスキップして前方マーカ判定ステップ40にもどる。
請求項(抜粋):
各文書が複数の論理構造で構成される構造化文書群から、指定した検索タームが指定した論理構造の中に存在する文書を検索する構造化分書検索方法において、文書の登録時に前記複数の論理構造の各々について論理構造の始まりを表わす前方マーカを検出するステップと、該前方マーカから該前方マーカに対応する論理構造の終わりを表わす後方マーカまでのテキスト長を算出するステップと、該前方マーカに該論理構造長を付加して検索用データベースを作成するステップを有し、文書の検索時に照合対象とするテキスト中から前方マーカを検出するとともに検索対象に指定した論理構造に該当する前方マーカであるか否かを判定するステップと、前記判定の結果、前方マーカが検索対象に指定された論理構造に該当する前方マーカであると判定された場合には、該当する論理構造に含まれるテキストに対し指定された検索タームとの文字列照合処理を行うステップと、前記判定の結果、前方マーカが検索対象に指定された論理構造に該当する前方マーカでないと判定された場合には、該論理構造長を参照して、該論理構造長だけテキストをスキップし文字列照合処理の対象から外すステップを有することを特徴とする構造化文書検索方法。
引用特許:
審査官引用 (3件)
  • 特開平4-084271
  • 特開平4-084271
  • 特開平1-237824

前のページに戻る