特許
J-GLOBAL ID:200903034000600269

類似文書検索システム

発明者:
出願人/特許権者:
代理人 (1件): 薄田 利幸
公報種別:公開公報
出願番号(国際出願番号):特願平6-273269
公開番号(公開出願番号):特開平8-137895
出願日: 1994年11月08日
公開日(公表日): 1996年05月31日
要約:
【要約】【目的】文書データベースを検索して原文書に類似した文書を抽出する類似文書検索システムにおいて、原文書から検索式を生成するときの条件を設定できるようにする。【構成】単語分割部3はテキストデータ43を読み込み、単語に分割する。単語出現頻度抽出部4はテキストデータ43を検索して単語出現頻度テーブルを作成する。検索式生成条件設定部2は選択された条件に基づいて検索式生成条件テーブルを生成する。検索式生成部5は単語出現テーブルと検索式生成条件とに基づいて検索式を生成する。テキストサーチ部7は与えられた検索式に基づいて文書データベース44を検索し、テキストデータ43に類似する文書を抽出する。
請求項(抜粋):
文書を構成するテキストデータを単語に分割する手段と、該テキストデータについて該単語の種類ごとに単語の出現頻度を算出して単語出現テーブルを作成する手段と、該単語の出現回数に関する条件を設定する検索式生成条件テーブルと、該検索式生成条件テーブルに設定された条件に合致する単語を該単語出現テーブルから選択して検索式を生成する手段と、該検索式に基づいて文書データベースを検索し該文書に類似の文書を抽出する手段とを有することを特徴とする類似文書検索システム。
FI (2件):
G06F 15/403 350 C ,  G06F 15/403 330 A
引用特許:
審査官引用 (1件)
  • キーワード自動抽出装置
    公報種別:公開公報   出願番号:特願平5-093655   出願人:日本電気株式会社, 日本電気ソフトウェア株式会社

前のページに戻る