Pat
J-GLOBAL ID:200903073047929817

類似文書検索システム及び方法並びに類似文書検索プログラムを記録したコンピュータ読み取り可能な記録媒体

Inventor:
Applicant, Patent owner:
Agent (1): 曾我 道照 (外6名)
Gazette classification:公開公報
Application number (International application number):1999257167
Publication number (International publication number):2001084252
Application date: Sep. 10, 1999
Publication date: Mar. 30, 2001
Summary:
【要約】【課題】 従来の自立語キーワードに基づく全文検索では、十分な検索精度を得られないという課題があった。【解決手段】 検索文を入力する入力手段101と、単語辞書103を参照して入力検索文の構造を解析する文構造解析手段102と、クラスタリングされた文書を格納した文書データベース105と、オントロジー109を参照して、入力検索文の解析結果と、文書データベースのクラスタに含まれる文書から検索時に索引として使用するクラスタ構造情報との類似度を計算する類似文照合手段108と、類似文照合手段により計算する類似度に基づいて入力検索文と最も類似するクラスタ構造情報を検索し、このクラスタ構造情報に対応づけられた前記文書データベース内の文書クラスタより類似文書を検索するクラスタ検索手段104とを備えた。【効果】 大規模な文書集合を検索対象とする場合でも文の構造を考慮した類似文書検索を可能とすることができる。
Claim (excerpt):
検索文を入力する入力手段と、文構造解析用の単語辞書と、前記単語辞書を参照して前記入力検索文の構造を解析する文構造解析手段と、クラスタリングされた文書を格納した文書データベースと、概念に関する知識を格納したオントロジーと、前記オントロジーを参照して、前記入力検索文の解析結果と、前記文書データベースのクラスタに含まれる文書から検索時に索引として使用するクラスタ構造情報との類似度を計算する類似文照合手段と、前記類似文照合手段により計算する類似度に基づいて前記入力検索文と最も類似するクラスタ構造情報を検索し、このクラスタ構造情報に対応づけられた前記文書データベース内の文書クラスタより類似文書を検索するクラスタ検索手段とを備えたことを特徴とする類似文書検索システム。
FI (3):
G06F 15/401 320 C ,  G06F 15/40 370 A ,  G06F 15/403 350 C
F-Term (8):
5B075ND03 ,  5B075NR02 ,  5B075NR12 ,  5B075NS01 ,  5B075PR06 ,  5B075QM08 ,  5B075QP03 ,  5B075QS01

Return to Previous Page