特許
J-GLOBAL ID:200903088917989052

対訳辞書作成方法

発明者:
出願人/特許権者:
代理人 (1件): 中村 純之助
公報種別:公開公報
出願番号(国際出願番号):特願平7-287135
公開番号(公開出願番号):特開平9-128396
出願日: 1995年11月06日
公開日(公表日): 1997年05月16日
要約:
【要約】【課題】対訳テキストから語の対訳データを抽出し、対訳辞書を自動生成する。これにより、文の対応づけがなされていない対訳テキストからの辞書作成を可能とする。【解決手段】第1言語のテキストと第2言語のテキストを読み込み(11)、第1言語のテキストに出現する語を抽出し(12)、各語について共起語の集合を求め(13)、第2言語のテキストに出現する語を抽出し(14)、各語について共起語の集合を求める(15)。第1言語の語と第2言語の語の組の各々について共起語集合の相関度を計算し(16)、互いに相関度が最大の語であるような語の組を選定し(17)、対訳辞書に登録する(18)。
請求項(抜粋):
第1言語のテキストと第2言語のテキストを入力装置から読み込む対訳テキスト読み込みステップ、第1言語のテキスト中に出現する語を抽出する第1言語テキスト解析ステップ、第1言語のテキストに出現する語の各々についてテキスト中で共起する語の集合即ち第1の共起語集合を抽出する第1言語共起データ抽出ステップ、第2言語のテキスト中で出現する語を抽出する第2言語テキスト解析ステップ、第2言語テキストに出現する語の各々についてテキスト中で共起する語の集合即ち第2の共起語集合を抽出する第2言語共起データ抽出ステップ、第1言語の語の上記共起語集合と第2言語の語の上記共起語集合との相関度を計算する相関度算出ステップ、共起語集合の相関度に基づいて第1言語の語と第2言語の語の組を選定する高相関語選定ステップ、前記選定された語の組を対訳辞書に登録する対訳データ登録ステップから構成されることを特徴とする対訳辞書作成方法。

前のページに戻る