特許
J-GLOBAL ID:200903036846775510

文書検索装置、文書検索方法、プログラム及びコンピュータに読み取り可能な記憶媒体

発明者:
出願人/特許権者:
代理人 (1件): 柏木 慎史 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願2001-249078
公開番号(公開出願番号):特開2003-058566
出願日: 2001年08月20日
公開日(公表日): 2003年02月28日
要約:
【要約】【課題】 ユーザが求めている的確な文書を検索することができるとともに、文章の流用があった場合であっても関連度を正しく計算することができる文書検索装置を提供する。【解決手段】 文書データベースからキーワードに適合する適合文書およびキーワードに適合しない非適合文書を選出する文書ランキング部(S2〜S4)と、選出された適合文書中に出現する単語のキーワードとの関連度を、当該単語の周囲の単語または文字が他の適合文書および非適合文書のものと異なる場合にのみ当該単語がその文書に出現しているものとして算出し、この関連度が高い単語をキーワードの関連語として選出する単語ランキング部(S6)と、選出された関連語をもとのキーワードに追加して新しいキーワードを生成するキーワード生成部(S7〜S9)と、を備え、生成された新しいキーワードに適合する適合文書を再度検索するようにした。
請求項(抜粋):
入力されたキーワードに適合する文書を複数の文書を保持する文書データベースから検索する文書検索装置において、前記文書データベースから前記キーワードに適合する適合文書および前記キーワードに適合しない非適合文書を選出する文書ランキング部と、この文書ランキング部で選出された前記適合文書中に出現する単語の前記キーワードとの関連度を、当該単語の周囲の単語または文字が他の前記適合文書および前記非適合文書のものと異なる場合にのみ当該単語がその文書に出現しているものとして算出し、この関連度が高い単語を前記キーワードの関連語として選出する単語ランキング部と、この単語ランキング部で選出された前記関連語をもとの前記キーワードに追加して新しいキーワードを生成するキーワード生成部と、を備え、前記キーワード生成部で生成された新しいキーワードに適合する適合文書を再度、前記文書ランキング部で検索するようにしたことを特徴とする文書検索装置。
IPC (2件):
G06F 17/30 320 ,  G06F 17/30 170
FI (2件):
G06F 17/30 320 D ,  G06F 17/30 170 A
Fターム (6件):
5B075ND03 ,  5B075NK10 ,  5B075NK35 ,  5B075NK44 ,  5B075PR06 ,  5B075UU06
引用特許:
審査官引用 (6件)
全件表示
引用文献:
前のページに戻る