Pat
J-GLOBAL ID:200903022894177720

分散型文書検索装置

Inventor:
Applicant, Patent owner:
Agent (1): 小笠原 吉義 (外1名)
Gazette classification:公開公報
Application number (International application number):1998327701
Publication number (International publication number):2000148787
Application date: Nov. 18, 1998
Publication date: May. 30, 2000
Summary:
【要約】【課題】 本発明は、文書検索に当って、出現頻度の少ない単語に関してのみ情報を交換・補正することによって、情報交換を行う頻度や通信量を低減する。【解決手段】 検索装置において、複数の文書部分集合管理手段をもうけると共に、検索要求統括装置をもうけておき、文書部分集合管理手段は、部分集合の中で出現頻度の少ない単語について、文書部分集合管理手段間で情報交換を行う。
Claim (excerpt):
文書集合の中から少なくとも1個の単語からなる組み合わせにより与えられる検索条件に適合する文書を抽出する検索装置において、少なくとも2個の文書部分集合管理手段を有すると共に検索要求統括手段を有し、前記各文書部分集合管理手段は、全文書集合のうち一部の文書部分集合を管理し、単語重要度計算手段と適合文書検索手段と単語重要度補正手段とを有し、前記単語重要度計算手段は、前記文書部分集合に含まれる単語について、該単語の出現頻度に応じて該単語の重要度を計算し、前記適合文書検索手段は、前記検索条件を構成する各単語を含む文書を前記文書部分集合から抽出して前記単語重要度に基づいて該文書の適合度を計算し、前記単語重要度補正手段は、該部分集合の中で出現頻度が所定の閾値よりも低い単語を抽出し、それ自体が属さない文書部分集合管理手段における該単語の出現頻度を収集して全文書集合における該単語の出現頻度および重要度を再計算する前記検索要求統括手段は、前記検索条件を前記各文書部分集合管理手段に指定して検索を要求し、前記各文書部分集合管理手段からの検索結果を収集及び統合して出力するよう構成されてなることを特徴とする分散型文書検索装置。
FI (3):
G06F 15/40 370 A ,  G06F 15/403 340 B ,  G06F 15/413 310 A
F-Term (9):
5B075KK02 ,  5B075ND03 ,  5B075NK02 ,  5B075PP22 ,  5B075PQ36 ,  5B075PQ74 ,  5B075PR06 ,  5B075QM08 ,  5B075UU06
Patent cited by the Patent:
Cited by examiner (2)
  • 並列テキスト検索システム
    Gazette classification:公開公報   Application number:特願平7-069471   Applicant:株式会社エイ・ティ・アール音声翻訳通信研究所
  • 分散データベースシステム
    Gazette classification:公開公報   Application number:特願平7-072554   Applicant:日立ソフトウエアエンジニアリング株式会社

Return to Previous Page