Pat
J-GLOBAL ID:200903067609295344

キーワード抽出方法及び装置

Inventor:
Applicant, Patent owner:
Agent (1): 鈴木 正剛
Gazette classification:公開公報
Application number (International application number):1997276093
Publication number (International publication number):1999120183
Application date: Oct. 08, 1997
Publication date: Apr. 30, 1999
Summary:
【要約】【課題】 項目分けされたテキスト(電子化された文書データ)からキーワードを自動的且つ高精度に抽出できるキーワード抽出装置を提供する。【解決手段】 重要度処理部15において、予めカテゴリ毎に分類された学習用テキスト群から各項目に存する学習単語及びその項目別出現頻度に基づく項目重要度を決定し、個々のカテゴリについての項目重要度の組を保持しておく。新規テキストが入力された場合は、その新規テキストが属するカテゴリについて保持されている項目重要度の組とその新規テキストから抽出した新規単語の項目別出現頻度とに基づいて各新規単語の単語重要度を決定してキーワード決定部17に渡す。キーワード決定部17は、単語重要度が相対的に高い所定数個の新規単語をキーワードとして特定して図示しない出力装置に出力する。
Claim (excerpt):
それぞれ項目分けされてカテゴリ毎に分類された学習用テキスト群から各項目に存する学習単語及びその項目別出現頻度に基づく項目重要度を決定するとともに、個々のカテゴリについての項目重要度の組を保持しておき、項目分けされてカテゴリ毎に分類された新規テキストからその特徴を表すキーワードを抽出する際に、当該新規テキストが属するカテゴリについて保持されている前記項目重要度の組と前記新規テキストから抽出した新規単語の項目別出現頻度とに基づいて各新規単語の単語重要度を決定し、この単語重要度が相対的に高い新規単語を前記キーワードとして特定することを特徴とするキーワード抽出方法。
FI (2):
G06F 15/401 310 A ,  G06F 15/403 340 A

Return to Previous Page