Pat
J-GLOBAL ID:200903034000600269

類似文書検索システム

Inventor:
Applicant, Patent owner:
Agent (1): 薄田 利幸
Gazette classification:公開公報
Application number (International application number):1994273269
Publication number (International publication number):1996137895
Application date: Nov. 08, 1994
Publication date: May. 31, 1996
Summary:
【要約】【目的】文書データベースを検索して原文書に類似した文書を抽出する類似文書検索システムにおいて、原文書から検索式を生成するときの条件を設定できるようにする。【構成】単語分割部3はテキストデータ43を読み込み、単語に分割する。単語出現頻度抽出部4はテキストデータ43を検索して単語出現頻度テーブルを作成する。検索式生成条件設定部2は選択された条件に基づいて検索式生成条件テーブルを生成する。検索式生成部5は単語出現テーブルと検索式生成条件とに基づいて検索式を生成する。テキストサーチ部7は与えられた検索式に基づいて文書データベース44を検索し、テキストデータ43に類似する文書を抽出する。
Claim (excerpt):
文書を構成するテキストデータを単語に分割する手段と、該テキストデータについて該単語の種類ごとに単語の出現頻度を算出して単語出現テーブルを作成する手段と、該単語の出現回数に関する条件を設定する検索式生成条件テーブルと、該検索式生成条件テーブルに設定された条件に合致する単語を該単語出現テーブルから選択して検索式を生成する手段と、該検索式に基づいて文書データベースを検索し該文書に類似の文書を抽出する手段とを有することを特徴とする類似文書検索システム。
FI (2):
G06F 15/403 350 C ,  G06F 15/403 330 A
Patent cited by the Patent:
Cited by examiner (1)
  • キーワード自動抽出装置
    Gazette classification:公開公報   Application number:特願平5-093655   Applicant:日本電気株式会社, 日本電気ソフトウェア株式会社

Return to Previous Page