特許
J-GLOBAL ID:200903064568655145
文書検索装置
発明者:
出願人/特許権者:
代理人 (3件):
長谷川 芳樹
, 塩田 辰也
, 寺崎 史朗
公報種別:公開公報
出願番号(国際出願番号):特願2003-133629
公開番号(公開出願番号):特開2004-334803
出願日: 2003年05月12日
公開日(公表日): 2004年11月25日
要約:
【課題】検索結果に占めるノイズの割合が小さい文書検索装置を提供する。【解決手段】文書検索装置1は、入力手段10、一次抽出手段30、類似度算出手段40、二次抽出手段50、及び出力手段60を備える。入力手段10は、論理検索条件及び基準文書を入力するためのものである。一次抽出手段30は、検索対象文書の中から、論理検索条件を満たすものを抽出する。類似度算出手段40は、一次抽出手段30により抽出された文書のそれぞれについて基準文書と類似する程度を表す類似度を算出する。二次抽出手段50は、一次抽出手段30により抽出された文書の中から、基準値以上の類似度をもつものを抽出する。出力手段60は、二次抽出手段50による抽出結果を出力する。【選択図】 図1
請求項(抜粋):
検索対象となる複数の検索対象文書の中から、所望の文書を検索する文書検索装置であって、
一の検索キーワード又は論理演算子で結合された二以上の検索キーワードから構成される論理検索条件と、前記所望の文書と近い内容を有する基準文書とを入力する入力手段と、
前記入力手段により入力された前記論理検索条件に基づいて前記複数の検索対象文書のそれぞれに対して論理検索を行うことにより、前記複数の検索対象文書のうち前記論理検索条件を満たすものを抽出する一次抽出手段と、
前記一次抽出手段により抽出された前記検索対象文書のそれぞれに対し、前記入力手段により入力された前記基準文書との比較を行うことにより、前記基準文書と類似する程度を表す類似度を算出する類似度算出手段と、
前記一次抽出手段により抽出された前記検索対象文書のうち、前記類似度算出手段により算出された前記類似度が所定の基準値以上であるものを抽出する二次抽出手段と、
前記二次抽出手段における抽出結果を出力する出力手段と、
を備えることを特徴とする文書検索装置。
IPC (1件):
FI (3件):
G06F17/30 340Z
, G06F17/30 170A
, G06F17/30 350C
Fターム (4件):
5B075ND03
, 5B075PR10
, 5B075QM05
, 5B075UU06
引用特許:
前のページに戻る