特許
J-GLOBAL ID:200903068573702548

半構造化文書情報統合検索装置および半構造化文書情報抽出装置、その方法、ならびにそのプログラムを格納する記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 三好 秀和 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平11-162990
公開番号(公開出願番号):特開2000-348061
出願日: 1999年06月09日
公開日(公表日): 2000年12月15日
要約:
【要約】【課題】 オープンなネットワーク上に散在する複数の半構造化文書に跨って内在する情報への一括した項目単位の検索を実現する。【解決手段】 入力問い合わせに基づき半構造化文書の所在を得る文書所在探索部131と、問い合わせを半構造化文書中の検索項目に対応する項目の表現形式に変換する問い合わせ変換部132と、変換された問い合わせにより半構造化文書を取得する文書検索部14と、半構造化文書から、抽出すべき項目ごとに区切るための文書構造情報に基づいて、項目データを抽出し、項目を条件検索するための属性情報に基づいて前記抽出された項目データを選択して検索結果とする文書処理部134と、検索結果を、各ユーザーごとに定義された項目の表現形式に変換する検索結果変換部135とを具備して統合検索装置を構成する。
請求項(抜粋):
オープンネットワーク上の複数の半構造化文書に内在する情報を検索する半構造化文書情報統合検索装置であって、半構造化文書ごとに該半構造化文書中から抽出すべき項目および該項目を条件検索するための項目情報を定義するメタ情報を記憶する記憶部と、入力された問い合わせから、前記メタ情報に基づいて、複数の半構造化文書に散在する情報を検索して一括した検索結果を得る検索部と、ユーザーごとに所定の単一フォーマットで前記検索結果を出力する出力部とを具備することを特徴とする半構造化文書情報統合検索装置。
IPC (2件):
G06F 17/30 ,  G06F 12/00 546
FI (4件):
G06F 15/40 340 ,  G06F 12/00 546 R ,  G06F 15/40 310 F ,  G06F 15/419 320
Fターム (7件):
5B075KK02 ,  5B075KK03 ,  5B075KK07 ,  5B075ND34 ,  5B075QM05 ,  5B082GA02 ,  5B082GC04

前のページに戻る