特許
J-GLOBAL ID:200903046503292810

文書ファイル検索装置及びプログラムを記録した機械読み取り可能な記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 境 廣巳
公報種別:公開公報
出願番号(国際出願番号):特願平10-129485
公開番号(公開出願番号):特開平11-306205
出願日: 1998年04月23日
公開日(公表日): 1999年11月05日
要約:
【要約】【課題】 WWW のホームページに対する自然言語による検索問い合わせを実現する。【解決手段】 検索対象文書ファイルであるWWW のホームページをXML で記述する。検索条件文が入力されるとキーワード抽出部4は、属性名を表現する自然言語表現はその属性名を含む属性名インデックスに、属性値を表現する自然言語表現はその属性値と属性名との対を含む属性値インデックスに変換する。キーワードフィルタ部5は、変換後のインデックス列中で、同一の属性の属性名インデックスと属性値インデックスとが隣どうしに存在する箇所の属性名インデックスを削除する。文書内容検査部6は、検索対象文書ファイル中に、変換後のインデックス列中の全ての属性値インデックスの属性名と属性値との対に対応するタグが存在するか否かを調べ、存在する場合、文書内容出力部9が変換後のインデックス列中の属性名インデックスの属性名を持つタグの属性値を検索して出力する。
請求項(抜粋):
属性の属性名とその属性の属性値との対を内蔵する文書ファイルを検索対象文書ファイルとし、検索対象文書ファイルから、利用者が自然言語で指定した検索条件に適合する部分を検索する文書ファイル検索装置において、自然言語で表現した検索要求文を先頭から順に探査し、属性名を表現する自然言語表現に対してはその属性名を属性名インデックスとして出力し、属性値を表現する自然言語表現に対してはその属性値と属性名との対を属性値インデックスとして出力することを順次行うキーワード抽出部と、前記キーワード抽出部の出力を入力して先頭から順に探査し、同一の属性の属性名インデックスと属性値インデックスとが隣どうしに存在する場合のみ、前記属性名インデックスを削除し、それ以外の部分はそのまま出力するキーワードフィルタ部と、検索対象文書ファイル中に、前記キーワードフィルタ部から出力された全ての属性値インデックスの属性名と属性値との対が内蔵されているか否かを調べ、内蔵されている場合、前記キーワードフィルタ部から出力された属性名インデックスの属性名に対応する属性値を検索対象文書ファイルから検索して出力する検索手段とを備えた文書ファイル検索装置。
FI (2件):
G06F 15/403 330 C ,  G06F 15/40 370 A

前のページに戻る