Pat
J-GLOBAL ID:200903097849479821

キーワード抽出方式

Inventor:
Applicant, Patent owner:
Agent (1): 高田 守
Gazette classification:公開公報
Application number (International application number):1994149775
Publication number (International publication number):1996030627
Application date: Jun. 30, 1994
Publication date: Feb. 02, 1996
Summary:
【要約】【目的】 テキストからキーワードを抽出する処理において、主に字面の解析を行なうことによって、処理を高速化する。また、使用頻度の高い語だけを集めた小規模な基本語辞書を利用して、複合語の分割や不必要なキーワードの削除を高速に行なう。【構成】 字種判別部1が判別した字種の情報を元にして、有効字種文字列(複合語)を切り出し、字種境界判別部6と接辞判別部10と基本語判別部14によって判別した分割点によって有効字種文字列(複合語)を分割し、名詞判別部4が名詞の可能性のない文字列を削除し、基本語削除部16が不必要なキーワードを削除する。さらに、必要キーワード切出部18が切り出した文字列を加えてキーワードとして出力する。
Claim (excerpt):
入力されたテキストの文字を種類分けする字種判別部と、この字種判別部で判別された字種を記憶する字種記憶手段と、この字種記憶手段が記憶した情報から有効な字種が続く限り文字列を切り出す有効字種文字列切出部と、名詞に後接する可能性のある平仮名文字列を格納した名詞後接平仮名文字列格納手段と、前記有効字種文字列切出部が切り出した文字列から、前記名詞後接平仮名文字列格納手段を使って名詞である可能性のある名詞候補文字列を抽出する名詞判別部と、を備えたキーワード抽出方式。

Return to Previous Page