Pat
J-GLOBAL ID:200903036218189407

共起データの補完方式

Inventor:
Applicant, Patent owner:
Agent (1): 工藤 宣幸 (外2名)
Gazette classification:公開公報
Application number (International application number):1991303432
Publication number (International publication number):1993346938
Application date: Nov. 19, 1991
Publication date: Dec. 27, 1993
Summary:
【要約】【目的】 例文から抽出された複数の共起データから、そこには存在しない共起データを作成して補完する。【構成】 ある単語には自然言語処理分野でいう意味的に近い単語が存在する。このような意味的に近い単語が、共起する相手単語は同一なことが多く、意味的な距離が近ければ近い程この傾向は強い。そこで、例文から抽出された共起データには存在しない、例文から抽出された共起データのいずれかの第1の構成単語といずれかの第2の構成単語の組み合わせを共起データとするか否かを、意味的な距離情報が近い他の単語がどのような相手と共起データを構成しているかに基づいて決定することとした(符号2、3、4)。
Claim (excerpt):
例文から抽出された複数の共起データについて得られた、共起データ総数、共起データ種類毎の個数、共起データを構成する第1の構成単語別の個数、及び、共起データを構成する第2の構成単語別の個数を保持し、これらの統計情報から、第1の構成単語間の意味的な距離情報、第2の構成単語間の意味的な距離情報を、全ての組み合わせについて算出し、例文から抽出された共起データには存在しない、上記第1の構成単語と上記第2の構成単語の組み合わせを共起データとするか否かを、これら第1又は第2の構成単語と意味的な距離が近い他の単語が、例文から抽出された共起データにどのように存在するかに基づいて決定することを特徴とした共起データの補完方式。

Return to Previous Page