Pat
J-GLOBAL ID:200903072245888089

テキスト構造解析装置および抄録装置、並びにプログラム記録媒体

Inventor:
Applicant, Patent owner:
Agent (1): 青山 葆 (外1名)
Gazette classification:公開公報
Application number (International application number):1998070288
Publication number (International publication number):1999272664
Application date: Mar. 19, 1998
Publication date: Oct. 08, 1999
Summary:
【要約】【課題】 精度の高いテキスト構造解析を行う。【解決手段】 テキスト入力手段1は、入力テキストを文に分割し、番号を付して記憶手段8のテキストデータベースに格納する。重要語認識手段2は、各文毎に重要語リストを作成して記憶手段8に格納する。重要語重み手段付け手段3は、各重要語に重みを付与する。関連度計算手段4は注目文と先行文との関連度を算出する。重要度計算手段5は注目文の重要度を算出する。木構造決定手段6は、注目文の親文を決定し、入力テキストの木構造を決定する。こうすることによって、単なるキーワードの文字列一致の場合とは異なり、二つの文の間のつながりの強さに基づいて各文の親文を決定することができ、精度の高いテキスト構造解析を行うことができる。
Claim (excerpt):
テキストを構成する各要素の間のつながりを解析し、この解析結果に基づいて上記各要素を節点とする木構造によって上記テキストの構造を表現するテキスト構造解析装置であって、入力されたテキストを上記要素に分割して、各要素の上記入力テキスト上における出現位置関係を記憶する要素出現位置記憶手段と、上記出現位置関係を参照して注目要素の先行要素を求め、上記注目要素と各先行要素とのつながりの強さを表す関連度を算出する関連度計算手段と、上記注目要素と各先行要素との関連度および上記入力テキストの先頭要素の重要度に基づいて上記注目要素の重要度を算出する重要度計算手段と、上記注目要素の重要度として最適値を与える先行要素を当該注目要素の親要素とすることによって、入力テキストの木構造を決定する構造決定手段と、上記決定された入力テキストの木構造を出力する出力手段を備えたことを特徴とするテキスト構造解析装置。
IPC (2):
G06F 17/27 ,  G06F 17/30
FI (2):
G06F 15/20 550 A ,  G06F 15/401 320 A
Patent cited by the Patent:
Cited by applicant (6)
Show all

Return to Previous Page