特許
J-GLOBAL ID:200903095873430695

キーワード抽出装置及び方法

発明者:
出願人/特許権者:
代理人 (1件): 高野 明近
公報種別:公開公報
出願番号(国際出願番号):特願平10-024394
公開番号(公開出願番号):特開平11-224255
出願日: 1998年02月05日
公開日(公表日): 1999年08月17日
要約:
【要約】【課題】 辞書や構文解析等によらず簡易な方法で、キーワードを自動的に抽出する。【解決手段】 自然言語処理装置を、入力した文書群内の単語と文書を認識する文書認識部と、文書群全体に対して認識された各単語の出現している文書の件数を数えかつ、その結果を記憶する出現文書件数記憶部と、該出現文書件数を基に、各単語をキーワード候補とするか否か決定するキーワード候補決定部と、文書群中の各文書について、前記キーワード候補と認識された各単語の出現回数を数えかつその結果を記憶する出現回数記憶部と、前記出現回数を基にキーワード候補の重要度を計算するキーワード重要度計算部で構成し、算出されたキーワード候補の重要度に基づきキーワードを抽出する。
請求項(抜粋):
入力した文書群内の単語と文書を認識する文書認識部と、文書群全体に対して認識された各単語の出現している文書の件数を数えかつ、その結果を記憶する出現文書件数記憶部と、該出現文書件数を基に、各単語をキーワード候補とするか否か決定するキーワード候補決定部と、文書群中の各文書について、前記キーワード候補と認識された各単語の出現回数を数えかつ、その結果を記憶する出現回数記憶部と、前記出現回数を基にキーワード候補の重要度を計算する重要度計算部、を備えたことを特徴とする自然言語処理装置。
IPC (2件):
G06F 17/30 ,  G06F 17/27
FI (3件):
G06F 15/401 310 A ,  G06F 15/20 550 A ,  G06F 15/40 370 A

前のページに戻る