特許
J-GLOBAL ID:200903097849479821

キーワード抽出方式

発明者:
出願人/特許権者:
代理人 (1件): 高田 守
公報種別:公開公報
出願番号(国際出願番号):特願平6-149775
公開番号(公開出願番号):特開平8-030627
出願日: 1994年06月30日
公開日(公表日): 1996年02月02日
要約:
【要約】【目的】 テキストからキーワードを抽出する処理において、主に字面の解析を行なうことによって、処理を高速化する。また、使用頻度の高い語だけを集めた小規模な基本語辞書を利用して、複合語の分割や不必要なキーワードの削除を高速に行なう。【構成】 字種判別部1が判別した字種の情報を元にして、有効字種文字列(複合語)を切り出し、字種境界判別部6と接辞判別部10と基本語判別部14によって判別した分割点によって有効字種文字列(複合語)を分割し、名詞判別部4が名詞の可能性のない文字列を削除し、基本語削除部16が不必要なキーワードを削除する。さらに、必要キーワード切出部18が切り出した文字列を加えてキーワードとして出力する。
請求項(抜粋):
入力されたテキストの文字を種類分けする字種判別部と、この字種判別部で判別された字種を記憶する字種記憶手段と、この字種記憶手段が記憶した情報から有効な字種が続く限り文字列を切り出す有効字種文字列切出部と、名詞に後接する可能性のある平仮名文字列を格納した名詞後接平仮名文字列格納手段と、前記有効字種文字列切出部が切り出した文字列から、前記名詞後接平仮名文字列格納手段を使って名詞である可能性のある名詞候補文字列を抽出する名詞判別部と、を備えたキーワード抽出方式。

前のページに戻る