Pat
J-GLOBAL ID:200903025474628432

文書検索装置および方法

Inventor:
Applicant, Patent owner:
Agent (1): 小川 勝男
Gazette classification:公開公報
Application number (International application number):1993135590
Publication number (International publication number):1994348757
Application date: Jun. 07, 1993
Publication date: Dec. 22, 1994
Summary:
【要約】【目的】 本体ファイルから圧縮ファイルを作成して等価的に全文検索を高速に行う文書検索装置および方法による文書検索に関し、検索者が指定したキーワードの本体ファイルにおける頻度情報を高速検索に利用することを可能にする。【構成】 単語分割部(1)、出現頻度検出部(2)、頻度ヘッダ作成部(3)を設けデータベース登録時に文書の頻度情報を得て、データ管理データファイル(e)、頻度情報付き圧縮データファイル(g)をデータベースに登録し、文書情報取得部(11)を設けることによって達成される。【効果】 データベースの中でも利用者の指定した頻度に適合した圧縮ファイルをもつ部分のみを検索対象とするので高速に全文検索可能で、かつ検索結果として得られた文書のキーワード以外の単語の文書間の総頻度や出現文書数を得ることができ、検索ノイズを低減することができる。
Claim (excerpt):
大量の文書を検索目的で蓄積しておく装置に関するもので、各文書データを単語毎に分割する手段と、分割された単語の出現頻度を算出する手段と該頻度情報を降順に並び変え単語の累積度数分布情報を算出する手段と、該累積度数分布情報を文書データベースに蓄積する手段と、蓄積された累積度数分布情報を参照して検索実行する手段を具備することを特徴とする文書検索装置。
IPC (2):
G06F 15/40 500 ,  G06F 15/40

Return to Previous Page