特許
J-GLOBAL ID:200903073047929817

類似文書検索システム及び方法並びに類似文書検索プログラムを記録したコンピュータ読み取り可能な記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 曾我 道照 (外6名)
公報種別:公開公報
出願番号(国際出願番号):特願平11-257167
公開番号(公開出願番号):特開2001-084252
出願日: 1999年09月10日
公開日(公表日): 2001年03月30日
要約:
【要約】【課題】 従来の自立語キーワードに基づく全文検索では、十分な検索精度を得られないという課題があった。【解決手段】 検索文を入力する入力手段101と、単語辞書103を参照して入力検索文の構造を解析する文構造解析手段102と、クラスタリングされた文書を格納した文書データベース105と、オントロジー109を参照して、入力検索文の解析結果と、文書データベースのクラスタに含まれる文書から検索時に索引として使用するクラスタ構造情報との類似度を計算する類似文照合手段108と、類似文照合手段により計算する類似度に基づいて入力検索文と最も類似するクラスタ構造情報を検索し、このクラスタ構造情報に対応づけられた前記文書データベース内の文書クラスタより類似文書を検索するクラスタ検索手段104とを備えた。【効果】 大規模な文書集合を検索対象とする場合でも文の構造を考慮した類似文書検索を可能とすることができる。
請求項(抜粋):
検索文を入力する入力手段と、文構造解析用の単語辞書と、前記単語辞書を参照して前記入力検索文の構造を解析する文構造解析手段と、クラスタリングされた文書を格納した文書データベースと、概念に関する知識を格納したオントロジーと、前記オントロジーを参照して、前記入力検索文の解析結果と、前記文書データベースのクラスタに含まれる文書から検索時に索引として使用するクラスタ構造情報との類似度を計算する類似文照合手段と、前記類似文照合手段により計算する類似度に基づいて前記入力検索文と最も類似するクラスタ構造情報を検索し、このクラスタ構造情報に対応づけられた前記文書データベース内の文書クラスタより類似文書を検索するクラスタ検索手段とを備えたことを特徴とする類似文書検索システム。
FI (3件):
G06F 15/401 320 C ,  G06F 15/40 370 A ,  G06F 15/403 350 C
Fターム (8件):
5B075ND03 ,  5B075NR02 ,  5B075NR12 ,  5B075NS01 ,  5B075PR06 ,  5B075QM08 ,  5B075QP03 ,  5B075QS01

前のページに戻る