特許
J-GLOBAL ID:200903052012925595

文書検索装置及び文書検索方法

発明者:
出願人/特許権者:
代理人 (1件): 外川 英明
公報種別:公開公報
出願番号(国際出願番号):特願2001-205569
公開番号(公開出願番号):特開2003-022277
出願日: 2001年07月06日
公開日(公表日): 2003年01月24日
要約:
【要約】【課題】 検索に際して単語間の概念階層を考慮した、適切な検索を可能とする文書検索装置及び文書検索方法を提供する。【解決手段】 シソーラス辞書5cに所定の単語の同意語や所定の単語の上位概念となる単語、下位概念となる単語など、単語間の概念階層に関する情報を予め格納する。制御装置1aが検索キー文書を用いて検索を行うときに、単語を用いたマッチング処理を行うが、この際、検索キー文書に含まれる単語の上位概念、下位概念の単語といった概念階層の異なる単語についてもマッチング処理を行う。検索結果については、マッチング処理を行った単語と、検索キー文書中の単語との間の概念階層についても考慮し、相対的に近い概念階層に含まれる単語には高い重みづけを行う。
請求項(抜粋):
文書を検索キーとして辞書を用い、文書データベースから所定の文書を検索する文書検索方法において、前記検索キーとなる文書から単語抽出を行う第一抽出ステップと、前記第一抽出ステップで抽出された単語について、所定の概念階層の範囲に含まれる単語を前記辞書から抽出する第二抽出ステップと、前記文書データベース中の文書から単語抽出を行う第三抽出ステップと、前記第一抽出ステップ及び前記第二抽出ステップにおいて抽出された単語と、前記第三抽出ステップにおいて抽出された単語との間で、マッチング処理を行うマッチング処理ステップと、このマッチング処理ステップでマッチング処理を行われた単語のうち、前記第二抽出ステップにおいて抽出された単語について、前記第一抽出ステップで抽出された単語に対して相対的に近い概念階層の単語について高い重み付けを行い、前記検索キー文書と前記文書データベース中の文書との間で類似度を計算する類似度計算ステップと、この類似度計算ステップによる計算結果に応じて、検索結果を出力する出力ステップとを具備することを特徴とする文書検索方法。
IPC (5件):
G06F 17/30 330 ,  G06F 17/30 170 ,  G06F 17/30 210 ,  G06F 17/30 320 ,  G06F 17/30 350
FI (5件):
G06F 17/30 330 C ,  G06F 17/30 170 A ,  G06F 17/30 210 A ,  G06F 17/30 320 D ,  G06F 17/30 350 C
Fターム (6件):
5B075ND03 ,  5B075NK35 ,  5B075PP24 ,  5B075PR06 ,  5B075QM08 ,  5B075UU40

前のページに戻る