特許
J-GLOBAL ID:200903068661611382

文書検索装置、文書検索方法及び文書検索プログラム

発明者:
出願人/特許権者:
代理人 (1件): 外川 英明
公報種別:公開公報
出願番号(国際出願番号):特願2002-276638
公開番号(公開出願番号):特開2004-118262
出願日: 2002年09月24日
公開日(公表日): 2004年04月15日
要約:
【課題】キー文書に類似する文書を検索する文書検索において、ノイズを減らす。【解決手段】検索キー文書に含まれる単語について、シソーラス辞書6を用いて上位単語、下位単語を抽出する際に、検索対象文書の中に当該上位単語や下位単語を含む文書数を算出し、予め設定した抑制条件を上回る文書数である場合、当該上位単語や下位単語は検索に用いないようにする。【選択図】 図4
請求項(抜粋):
検索キーを用いて検索対象文書から文書を検索する文書検索装置であって、 前記検索キーから検索に用いる単語を抽出する検索キー単語抽出手段と、 類義語を格納したシソーラス辞書と、 前記検索キー単語抽出手段により抽出された単語と前記シソーラス辞書に基づき、前記抽出された単語の上位概念方向に類義語の抽出動作を行う類義語抽出手段と、 前記検索対象文書のうち、前記類義後抽出手段により抽出された類義語を含む文書の数を算出する算出手段と、 前記算出手段により算出された文書の数に応じ、前記類義語を選別する選別手段と、 前記検索対象文書の中から検索対象単語を抽出する検索対象単語抽出手段と、前記検索キー単語抽出手段により得られた単語と、前記選別手段により選別された類義語と、前記検索対象単語抽出手段により得られた単語に基づき、文書を検索する検索手段を具備することを特徴とする文書検索装置。
IPC (1件):
G06F17/30
FI (3件):
G06F17/30 320D ,  G06F17/30 170A ,  G06F17/30 340Z
Fターム (4件):
5B075ND03 ,  5B075NK32 ,  5B075NK35 ,  5B075UU06

前のページに戻る