特許
J-GLOBAL ID:200903067609295344

キーワード抽出方法及び装置

発明者:
出願人/特許権者:
代理人 (1件): 鈴木 正剛
公報種別:公開公報
出願番号(国際出願番号):特願平9-276093
公開番号(公開出願番号):特開平11-120183
出願日: 1997年10月08日
公開日(公表日): 1999年04月30日
要約:
【要約】【課題】 項目分けされたテキスト(電子化された文書データ)からキーワードを自動的且つ高精度に抽出できるキーワード抽出装置を提供する。【解決手段】 重要度処理部15において、予めカテゴリ毎に分類された学習用テキスト群から各項目に存する学習単語及びその項目別出現頻度に基づく項目重要度を決定し、個々のカテゴリについての項目重要度の組を保持しておく。新規テキストが入力された場合は、その新規テキストが属するカテゴリについて保持されている項目重要度の組とその新規テキストから抽出した新規単語の項目別出現頻度とに基づいて各新規単語の単語重要度を決定してキーワード決定部17に渡す。キーワード決定部17は、単語重要度が相対的に高い所定数個の新規単語をキーワードとして特定して図示しない出力装置に出力する。
請求項(抜粋):
それぞれ項目分けされてカテゴリ毎に分類された学習用テキスト群から各項目に存する学習単語及びその項目別出現頻度に基づく項目重要度を決定するとともに、個々のカテゴリについての項目重要度の組を保持しておき、項目分けされてカテゴリ毎に分類された新規テキストからその特徴を表すキーワードを抽出する際に、当該新規テキストが属するカテゴリについて保持されている前記項目重要度の組と前記新規テキストから抽出した新規単語の項目別出現頻度とに基づいて各新規単語の単語重要度を決定し、この単語重要度が相対的に高い新規単語を前記キーワードとして特定することを特徴とするキーワード抽出方法。
FI (2件):
G06F 15/401 310 A ,  G06F 15/403 340 A

前のページに戻る