特許
J-GLOBAL ID:201803014578311277

単語アライメントモデル構築装置、機械翻訳装置、単語アライメントモデルの生産方法、およびプログラム

発明者:
出願人/特許権者:
代理人 (1件): 谷川 英和
公報種別:公開公報
出願番号(国際出願番号):特願2016-212433
公開番号(公開出願番号):特開2018-073139
出願日: 2016年10月31日
公開日(公表日): 2018年05月10日
要約:
【課題】従来、対訳データが十分に大きくない場合等、単語アライメントを精度よく実行できなかった。特に、対訳データにおいて、一方の言語の単語を条件としたときに、他方の言語の単語がアライメントされる確率を、単語の字面のみから推定していた。その結果として、対訳データが十分に大きくないときには、単語アライメントの確率を精度よく推定できなかった。【解決手段】EステップとMステップとを適切な回数、繰り返して単語アライメントを実行する装置において、Eステップにおける処理の中で、単語クラスを活用することにより、小規模の対訳データを使用する場合や、低頻度単語においても、単語アライメントを精度よく実行できる。【選択図】図1
請求項(抜粋):
第一言語文と第二言語文との対である2以上の対訳文である対訳データを用いて、EステップとMステップとを繰り返し行うEM法により、単語アライメントモデルを構築する単語アライメントモデル構築装置であって、 前記Eステップにおいて、 単語対のアライメント確率に関する単語対確率情報と単語クラスに基づくアライメント確率に関するクラス使用単語対応確率情報とを算出し、当該算出された単語対確率情報とクラス使用単語対応確率情報とを用いて単語アライメント確率に関する単語対確率情報を算出し、当該単語アライメント確率に関する単語対確率情報と単語対とを含む2以上の単語アライメントデータを有する単語アライメントモデルを記録媒体に蓄積する単語アライメントモデル構築装置。
IPC (2件):
G06F 17/28 ,  G06F 17/30
FI (3件):
G06F17/28 627 ,  G06F17/30 220Z ,  G06F17/30 170A
Fターム (5件):
5B091AA03 ,  5B091BA03 ,  5B091BA11 ,  5B091CA21 ,  5B091EA01

前のページに戻る