特許
J-GLOBAL ID:200903062320392536
文書検索装置及び文書検索方法
発明者:
,
,
,
,
出願人/特許権者:
代理人 (1件):
外川 英明
公報種別:公開公報
出願番号(国際出願番号):特願2001-299137
公開番号(公開出願番号):特開2003-108579
出願日: 2001年09月28日
公開日(公表日): 2003年04月11日
要約:
【要約】【課題】 効率的に検索精度を高めることができる類似文書検索装置及び類似文書検索方法を提供すること。【解決手段】 検索キー文書及び検索対象文書に含まれる単語について、上位語をシソーラス辞書6から採用し、この単語と上位語を用いて一度目の検索を行う。この検索により絞り込まれた検索対象文書と検索キー文書に含まれる単語について、下位語をシソーラス辞書6から採用し、この単語と下位語を用いて二度目の検索を実行する。
請求項(抜粋):
文書を検索キーとして検索対象文書から類似文書を検索する文書検索装置であって、前記検索対象文書の中から検索対象単語を抽出する検索対象単語抽出手段と、前記検索キーとなる文書から検索キーとなる単語を抽出する検索キー単語抽出手段と、前記検索対象単語抽出手段及び前記検索キー単語抽出手段により抽出された単語の上位語を抽出する上位語抽出手段と、前記検索対象単語抽出手段及び前記検索キー単語抽出手段により得られた単語と前期上位語抽出手段により得られた上位語を元に、前記検索キー文書と前記検索対象文書の第一の類似度を求める第一類似度算出手段と、前記第一類似度算出手段により求められた第一の類似度に基づき前記検索対象文書を絞り込む絞り込み手段と、前記絞り込み手段により絞り込まれた検索対象文書について検索対象単語抽出手段により抽出された単語の下位語と、前記検索キー単語抽出手段により抽出された単語の下位語を抽出する下位語抽出手段と、前記絞り込み手段により絞り込まれた検索対象文書について前記検索対象単語抽出手段により得られた単語と、前記キー単語抽出手段により得られた単語と、前記下位語抽出手段により得られた下位語をもとに、前記検索キー文書と前記絞り込まれた検索対象文書の第二の類似度を求める第二類似度算出手段と、前記第二類似度算出手段により算出された類似度に基づき検索結果を出力する出力手段とを具備することを特徴とする文書検索装置。
IPC (3件):
G06F 17/30 320
, G06F 17/30 170
, G06F 17/30 350
FI (3件):
G06F 17/30 320 D
, G06F 17/30 170 A
, G06F 17/30 350 C
Fターム (7件):
5B075ND03
, 5B075NK32
, 5B075PP28
, 5B075PR06
, 5B075QM08
, 5B075QP03
, 5B075UU06
前のページに戻る