Pat
J-GLOBAL ID:200903068573702548

半構造化文書情報統合検索装置および半構造化文書情報抽出装置、その方法、ならびにそのプログラムを格納する記録媒体

Inventor:
Applicant, Patent owner:
Agent (1): 三好 秀和 (外1名)
Gazette classification:公開公報
Application number (International application number):1999162990
Publication number (International publication number):2000348061
Application date: Jun. 09, 1999
Publication date: Dec. 15, 2000
Summary:
【要約】【課題】 オープンなネットワーク上に散在する複数の半構造化文書に跨って内在する情報への一括した項目単位の検索を実現する。【解決手段】 入力問い合わせに基づき半構造化文書の所在を得る文書所在探索部131と、問い合わせを半構造化文書中の検索項目に対応する項目の表現形式に変換する問い合わせ変換部132と、変換された問い合わせにより半構造化文書を取得する文書検索部14と、半構造化文書から、抽出すべき項目ごとに区切るための文書構造情報に基づいて、項目データを抽出し、項目を条件検索するための属性情報に基づいて前記抽出された項目データを選択して検索結果とする文書処理部134と、検索結果を、各ユーザーごとに定義された項目の表現形式に変換する検索結果変換部135とを具備して統合検索装置を構成する。
Claim (excerpt):
オープンネットワーク上の複数の半構造化文書に内在する情報を検索する半構造化文書情報統合検索装置であって、半構造化文書ごとに該半構造化文書中から抽出すべき項目および該項目を条件検索するための項目情報を定義するメタ情報を記憶する記憶部と、入力された問い合わせから、前記メタ情報に基づいて、複数の半構造化文書に散在する情報を検索して一括した検索結果を得る検索部と、ユーザーごとに所定の単一フォーマットで前記検索結果を出力する出力部とを具備することを特徴とする半構造化文書情報統合検索装置。
IPC (2):
G06F 17/30 ,  G06F 12/00 546
FI (4):
G06F 15/40 340 ,  G06F 12/00 546 R ,  G06F 15/40 310 F ,  G06F 15/419 320
F-Term (7):
5B075KK02 ,  5B075KK03 ,  5B075KK07 ,  5B075ND34 ,  5B075QM05 ,  5B082GA02 ,  5B082GC04

Return to Previous Page