特許
J-GLOBAL ID:200903040530708192

文書検索装置及び文書検索方法

発明者:
出願人/特許権者:
公報種別:公開公報
出願番号(国際出願番号):特願2000-388596
公開番号(公開出願番号):特開2002-189754
出願日: 2000年12月21日
公開日(公表日): 2002年07月05日
要約:
【要約】 (修正有)【課題】 類似文書を検索するときに、検索適合文書の適合度を計算する際に、検索要求文書集合の内容に適合している文書ほど適合度が高くなるようにする文書検索装置を提供する。【解決手段】 検索要求文書集合記憶部内の文書に含まれる単語の重要度に基づいて検索語を決定する。前記検索要求文書集合の文書ごとに単語出現位置情報を算出して、先の検索語の位置情報に基づいて検索語間の関連度をすべての組み合わせについて算出する。また、先の検索語を用いて検索対象文書集合の検索適合文書を検索し、適合文書に含まれる単語に対して単語出現位置情報を算出して、先の検索語の位置情報に基づいて検索語間の関連度をすべての組み合わせについて算出する。これらの前記検索要求文書における検索語関連度と前記検索適合文書における検索語関連度に基づいて、ユーザーの所望する文書を検索する。
請求項(抜粋):
検索要求文書集合に含まれる文書を指定し、その指定された文書の内容に類似した文書を検索対象文書集合から検索する文書検索装置であって、検索対象文書を入力する検索対象文書入力部と、入力された検索対象文書を集合として記憶する検索対象文書集合記憶部と、検索要求文書を入力する検索要求文書入力部と、入力された検索要求文書を集合として記憶する検索要求文書集合記憶部と、前記検索要求文書集合記憶部内の文書に含まれる単語を解析する検索要求文書単語解析部と、前記検索要求文書単語解析部で解析された単語の重要度を算出する単語重要度算出部と、この単語重要度に基づいて検索語を決定する検索語決定部と、前記検索要求文書集合記憶部内の文書ごとに単語出現位置情報を算出する検索要求文書単語位置情報算出部と、前記検索要求文書集合記憶部内の各文書について検索語の位置情報に基づいて2つの検索語間の関連度をすべての組み合わせについて算出する検索要求文書集合検索語関連度算出部と、検索語を用いて前記検索対象文書集合記憶部内の検索適合文書を検索する検索部と、この検索適合文書を記憶する検索適合文書集合記憶部と、前記検索適合文書集合記憶部内の文書に含まれる単語を解析する検索適合文書単語解析部と、前記検索適合文書集合記憶部内の文書ごとに単語出現位置情報を算出する検索適合文書単語位置情報算出部と、前記検索適合文書集合記憶部の各適合文書について検索語の位置情報に基づいて2つの検索語間の関連度をすべての組み合わせについて算出する検索適合文書検索語関連度算出部と、前記検索要求文書集合検索語関連度と前記検索適合文書検索語関連度に基づいて前記検索適合文書集合記憶部内の各検索適合文書の適合度を算出する検索適合文書適合度算出部と、前記検索適合文書集合記憶部内の文書情報とこの文書に対応する前記適合度とを表示する検索適合文書集合表示部とを持つことを特徴とする文書検索装置。
IPC (3件):
G06F 17/30 350 ,  G06F 17/30 170 ,  G06F 17/30 210
FI (3件):
G06F 17/30 350 C ,  G06F 17/30 170 A ,  G06F 17/30 210 A
Fターム (7件):
5B075NK31 ,  5B075PQ02 ,  5B075PQ36 ,  5B075PQ46 ,  5B075PR06 ,  5B075QM08 ,  5B075UU06
引用特許:
審査官引用 (6件)
全件表示
引用文献:
前のページに戻る