特許
J-GLOBAL ID:200903036218189407
共起データの補完方式
発明者:
出願人/特許権者:
代理人 (1件):
工藤 宣幸 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平3-303432
公開番号(公開出願番号):特開平5-346938
出願日: 1991年11月19日
公開日(公表日): 1993年12月27日
要約:
【要約】【目的】 例文から抽出された複数の共起データから、そこには存在しない共起データを作成して補完する。【構成】 ある単語には自然言語処理分野でいう意味的に近い単語が存在する。このような意味的に近い単語が、共起する相手単語は同一なことが多く、意味的な距離が近ければ近い程この傾向は強い。そこで、例文から抽出された共起データには存在しない、例文から抽出された共起データのいずれかの第1の構成単語といずれかの第2の構成単語の組み合わせを共起データとするか否かを、意味的な距離情報が近い他の単語がどのような相手と共起データを構成しているかに基づいて決定することとした(符号2、3、4)。
請求項(抜粋):
例文から抽出された複数の共起データについて得られた、共起データ総数、共起データ種類毎の個数、共起データを構成する第1の構成単語別の個数、及び、共起データを構成する第2の構成単語別の個数を保持し、これらの統計情報から、第1の構成単語間の意味的な距離情報、第2の構成単語間の意味的な距離情報を、全ての組み合わせについて算出し、例文から抽出された共起データには存在しない、上記第1の構成単語と上記第2の構成単語の組み合わせを共起データとするか否かを、これら第1又は第2の構成単語と意味的な距離が近い他の単語が、例文から抽出された共起データにどのように存在するかに基づいて決定することを特徴とした共起データの補完方式。
前のページに戻る