特許
J-GLOBAL ID:200903088765712459

関連キーワード自動抽出装置、文書検索装置及びこれらを用いた文書検索システム

発明者:
出願人/特許権者:
代理人 (1件): 蔵合 正博
公報種別:公開公報
出願番号(国際出願番号):特願平9-176822
公開番号(公開出願番号):特開平11-025108
出願日: 1997年07月02日
公開日(公表日): 1999年01月29日
要約:
【要約】【課題】 実際の検索対象文書の特性に即し、かつそのキーワードによる検索を実行した場合少なくとも1件以上の検索結果が得られるような関連キーワードを自動抽出すること。【解決手段】 関連キーワード自動抽出装置として、各文書の属性情報や入力検索式などに基づいて文書の部分集合を特定する文書集合選定部19と、各単語の対象文書11全体における統計情報14および文書毎に出現する単語とその統計情報15を管理する単語統計情報管理部17と、単語統計情報14、15を基に、或る文書の部分集合に出現する各単語の重要度を算出して重要度の順に整列する単語ランキング部18とを設け、単語統計情報管理部により、文書全体、および特定された文書部分集合における各単語の統計情報を高速に求める。これにより、或る文書集合に出現する単語を、その重要度に基づいてランキングし、その一部を関連キーワードとして提示することができる。
請求項(抜粋):
辞書を用いて対象文書集合の各文書に出現する単語または単語の組の出現頻度や分布などの統計情報があらかじめ抽出されている文書集合に対して、各文書に付与された属性情報やユーザが入力した検索式などに基づいて文書の部分集合を特定する文書集合選定部と、各単語の対象文書全体における統計情報、および各文書ごとの当該文書に出現する単語とその統計情報を管理する単語統計情報管理部と、各単語の全文書および各文書ごとの統計情報を基に、特定された部分集合に出現する各単語の重要度を算出して重要度の順に整列する単語ランキング部とを有し、整列された単語群のうちの特定部分のみについて、単語もしくは単語とその重要度の組を抽出し、これを再利用可能な形で提示するようにしたことを特徴とする関連キーワード自動抽出装置。
FI (2件):
G06F 15/401 310 A ,  G06F 15/40 370 A
引用特許:
審査官引用 (7件)
全件表示

前のページに戻る