特許
J-GLOBAL ID:200903080490753108
文書検索装置および文書検索方法ならびにそのプログラムと記録媒体
発明者:
出願人/特許権者:
代理人 (3件):
上柳 雅誉
, 藤綱 英吉
, 須澤 修
公報種別:公開公報
出願番号(国際出願番号):特願2005-129079
公開番号(公開出願番号):特開2006-309377
出願日: 2005年04月27日
公開日(公表日): 2006年11月09日
要約:
【課題】 関連語辞書のデータベースを自動的に作成できる文書検索装置であって、従来よりも検索文に含まれる単語の関連語をより精度良く検出することで、さらなる文書検索の精度を上げることができる文書検索装置を提供する。【解決手段】 検索文とその検索文内の単語を関連語に置き換えた検索文とにより、検索対象文書をベクトル検索する。そして、検索結果において、選択された件名に含まれる単語と、検索文に含まれる単語とを用いて関連語辞書のデータベースを自動生成する。【選択図】 図1
請求項(抜粋):
入力された検索文に関連する検索対象文書を出力する文書検索装置であって、
既に学習された情報として、前記検索文に含まれる単語を被関連語とその被関連語に関連する関連語との対応関係の情報を記憶し、またそれら被関連語と関連語との関連の強さを示す関連度を対応付けて記憶する関連語記憶部と、
前記検索文に含まれる各単語のうち、前記関連語記憶部に前記関連語が対応付けられて記憶されている単語については、その関連語に置き換える検索語置換処理部と、
前記置き換え後の検索文のうち、置き換えた単語についてはその単語の重みに前記関連度を乗じた値を用いて、当該置き換え後の検索文の各単語の検索文書ベクトルを生成し、また、当該置き換え後の検索文に含まれる各単語の前記検索対象文書における重みの値に基づいて対象文書ベクトルを生成し、それら検索文書ベクトルと対象文書ベクトルと、の成す角度に応じて、当該成す角度が小さい所定の数の検索対象文書を、検索対象文書記憶部に記憶している複数の検索対象文書の中から抽出する検索対象文書抽出処理部と、
前記抽出された検索文書の件名を、前記検索文書ベクトルと対象文書ベクトルとの成す角度に応じて順次表示できる検索結果画面データを生成する検索結果画面生成処理部と、
前記検索結果画面データを出力する検索結果画面出力処理部と、
を備えることを特徴とする文書検索装置。
IPC (1件):
FI (3件):
G06F17/30 320D
, G06F17/30 170A
, G06F17/30 350C
Fターム (12件):
5B075ND03
, 5B075NK02
, 5B075NK14
, 5B075NK24
, 5B075NK35
, 5B075PP22
, 5B075PQ02
, 5B075PQ46
, 5B075PQ74
, 5B075PR06
, 5B075QM10
, 5B075UU06
引用特許:
前のページに戻る