Pat
J-GLOBAL ID:200903064568655145

文書検索装置

Inventor:
Applicant, Patent owner:
Agent (3): 長谷川 芳樹 ,  塩田 辰也 ,  寺崎 史朗
Gazette classification:公開公報
Application number (International application number):2003133629
Publication number (International publication number):2004334803
Application date: May. 12, 2003
Publication date: Nov. 25, 2004
Summary:
【課題】検索結果に占めるノイズの割合が小さい文書検索装置を提供する。【解決手段】文書検索装置1は、入力手段10、一次抽出手段30、類似度算出手段40、二次抽出手段50、及び出力手段60を備える。入力手段10は、論理検索条件及び基準文書を入力するためのものである。一次抽出手段30は、検索対象文書の中から、論理検索条件を満たすものを抽出する。類似度算出手段40は、一次抽出手段30により抽出された文書のそれぞれについて基準文書と類似する程度を表す類似度を算出する。二次抽出手段50は、一次抽出手段30により抽出された文書の中から、基準値以上の類似度をもつものを抽出する。出力手段60は、二次抽出手段50による抽出結果を出力する。【選択図】 図1
Claim (excerpt):
検索対象となる複数の検索対象文書の中から、所望の文書を検索する文書検索装置であって、 一の検索キーワード又は論理演算子で結合された二以上の検索キーワードから構成される論理検索条件と、前記所望の文書と近い内容を有する基準文書とを入力する入力手段と、 前記入力手段により入力された前記論理検索条件に基づいて前記複数の検索対象文書のそれぞれに対して論理検索を行うことにより、前記複数の検索対象文書のうち前記論理検索条件を満たすものを抽出する一次抽出手段と、 前記一次抽出手段により抽出された前記検索対象文書のそれぞれに対し、前記入力手段により入力された前記基準文書との比較を行うことにより、前記基準文書と類似する程度を表す類似度を算出する類似度算出手段と、 前記一次抽出手段により抽出された前記検索対象文書のうち、前記類似度算出手段により算出された前記類似度が所定の基準値以上であるものを抽出する二次抽出手段と、 前記二次抽出手段における抽出結果を出力する出力手段と、 を備えることを特徴とする文書検索装置。
IPC (1):
G06F17/30
FI (3):
G06F17/30 340Z ,  G06F17/30 170A ,  G06F17/30 350C
F-Term (4):
5B075ND03 ,  5B075PR10 ,  5B075QM05 ,  5B075UU06
Patent cited by the Patent:
Cited by examiner (6)
Show all

Return to Previous Page