特許
J-GLOBAL ID:200903022894177720

分散型文書検索装置

発明者:
出願人/特許権者:
代理人 (1件): 小笠原 吉義 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平10-327701
公開番号(公開出願番号):特開2000-148787
出願日: 1998年11月18日
公開日(公表日): 2000年05月30日
要約:
【要約】【課題】 本発明は、文書検索に当って、出現頻度の少ない単語に関してのみ情報を交換・補正することによって、情報交換を行う頻度や通信量を低減する。【解決手段】 検索装置において、複数の文書部分集合管理手段をもうけると共に、検索要求統括装置をもうけておき、文書部分集合管理手段は、部分集合の中で出現頻度の少ない単語について、文書部分集合管理手段間で情報交換を行う。
請求項(抜粋):
文書集合の中から少なくとも1個の単語からなる組み合わせにより与えられる検索条件に適合する文書を抽出する検索装置において、少なくとも2個の文書部分集合管理手段を有すると共に検索要求統括手段を有し、前記各文書部分集合管理手段は、全文書集合のうち一部の文書部分集合を管理し、単語重要度計算手段と適合文書検索手段と単語重要度補正手段とを有し、前記単語重要度計算手段は、前記文書部分集合に含まれる単語について、該単語の出現頻度に応じて該単語の重要度を計算し、前記適合文書検索手段は、前記検索条件を構成する各単語を含む文書を前記文書部分集合から抽出して前記単語重要度に基づいて該文書の適合度を計算し、前記単語重要度補正手段は、該部分集合の中で出現頻度が所定の閾値よりも低い単語を抽出し、それ自体が属さない文書部分集合管理手段における該単語の出現頻度を収集して全文書集合における該単語の出現頻度および重要度を再計算する前記検索要求統括手段は、前記検索条件を前記各文書部分集合管理手段に指定して検索を要求し、前記各文書部分集合管理手段からの検索結果を収集及び統合して出力するよう構成されてなることを特徴とする分散型文書検索装置。
FI (3件):
G06F 15/40 370 A ,  G06F 15/403 340 B ,  G06F 15/413 310 A
Fターム (9件):
5B075KK02 ,  5B075ND03 ,  5B075NK02 ,  5B075PP22 ,  5B075PQ36 ,  5B075PQ74 ,  5B075PR06 ,  5B075QM08 ,  5B075UU06
引用特許:
出願人引用 (2件)
  • 並列テキスト検索システム
    公報種別:公開公報   出願番号:特願平7-069471   出願人:株式会社エイ・ティ・アール音声翻訳通信研究所
  • 分散データベースシステム
    公報種別:公開公報   出願番号:特願平7-072554   出願人:日立ソフトウエアエンジニアリング株式会社
審査官引用 (2件)
  • 並列テキスト検索システム
    公報種別:公開公報   出願番号:特願平7-069471   出願人:株式会社エイ・ティ・アール音声翻訳通信研究所
  • 分散データベースシステム
    公報種別:公開公報   出願番号:特願平7-072554   出願人:日立ソフトウエアエンジニアリング株式会社

前のページに戻る