Pat
J-GLOBAL ID:200903099277764131

類似文書検索装置及び類似文書検索方法

Inventor:
Applicant, Patent owner:
Agent (1): 須山 佐一
Gazette classification:公開公報
Application number (International application number):1997231363
Publication number (International publication number):1999073415
Application date: Aug. 27, 1997
Publication date: Mar. 16, 1999
Summary:
【要約】【課題】 ある文書(検索キー文書)と類似する文書を複数の検索対象文書のなかから検索する装置において、より信憑性の高い類似文書検索を実現する。【解決手段】 検索キー文書と各検索対象文書との各々の類似度値の統計分布(例えば類似度の平均値)を求め、この統計分布を基準に、ユーザが設定した条件を満足するものを類似文書として抽出する。従来のように単に類似度値が高いものを類似文書として抽出する方式に比べ、類似文書としてより信憑性の高いものを検索結果として得ることができる。また、検索キー文書と各検索対象文書との類似度がどれも一般的な評価基準において高いとは言えないような場合に、類似文書がないことを検索結果として出力する。
Claim (excerpt):
検索キー文書に類似する文書を複数の検索対象文書のなかから検索する類似文書検索装置において、前記検索キー文書と前記各検索対象文書との類似度を算出する類似度算出手段と、前記類似度算出手段によって算出された各検索対象文書の類似度の統計情報を求める統計情報算出手段と、前記統計情報を基準とする類似文書の抽出条件を設定する抽出条件設定手段と、前記類似度算出手段によって算出された各検索対象文書の類似度および前記抽出条件設定手段により設定された抽出条件に基づいて類似文書を検索する検索手段とを具備することを特徴とする類似文書検索装置。

Return to Previous Page