特許
J-GLOBAL ID:201703019650112882

自動翻訳の素性重み最適化装置及びそのためのコンピュータプログラム

発明者:
出願人/特許権者:
代理人 (1件): 清水 敏
公報種別:公開公報
出願番号(国際出願番号):特願2016-034682
公開番号(公開出願番号):特開2017-151804
出願日: 2016年02月25日
公開日(公表日): 2017年08月31日
要約:
【課題】より確実に、素性重みを高い精度で最適化できる素性重みの最適化装置を提供する。【解決手段】 自動翻訳の素性重み最適化装置は、複数のドメイン開発セット212と、複数のドメイン開発セット212を用い、複数のドメイン別統計モデル272及び汎用統計モデル274から得られる素性又はその対数の線形補間を用いて自然言語の翻訳を行う際の各素性重みを最適化する素性重み最適化部278とを含む。素性重み最適化部278は、ドメイン開発セット212の各々について設けられたドメイン別素性記憶領域を持ち、その各々は、汎用統計モデルの素性を記憶する第1の領域と、複数のドメイン開発セットから得られる素性を記憶する複数の第2の領域と、重みの最適化に用いられる損失関数の値を記憶する第3の領域とを含む。損失関数は、自動翻訳による翻訳文とその参照訳との間の相違を表す関数である。【選択図】図5
請求項(抜粋):
各々、互いに異なる複数のドメインの翻訳用の複数のドメイン別統計モデルと、特定のドメインに限定されない汎用訓練コーパスから得られた翻訳用の汎用統計モデルとを記憶するためのモデル記憶手段と、 前記複数のドメインに対してそれぞれ準備された自然言語の対訳文からなる複数のドメイン開発セットを記憶するためのドメイン開発セット記憶手段と、 前記ドメイン開発セット記憶手段に記憶された前記複数のドメイン開発セットを用い、各モデルから得られる素性値又はその対数の線形補間を用いて自然言語の翻訳を行う際の各素性重みを最適化するための重み最適化手段とを含む、自動翻訳の素性重み最適化装置であって、 前記重み最適化手段は、 前記複数のドメイン開発セットの各々について設けられたドメイン別素性記憶領域を有する記憶手段を含み、 前記ドメイン別素性記憶領域の各々は、前記汎用統計モデルから得られる素性値を記憶する第1の領域と、前記複数のドメイン開発セットからそれぞれ得られる素性値を記憶する複数の第2の領域とを含み、 前記各対訳文は、原文と、当該原文の参照訳とを含み、 前記重み最適化手段はさらに、 前記複数のドメイン開発セットに含まれる各対訳文の原文に対して、当該対訳文の属するドメイン用の統計モデルと、前記汎用統計モデルから当該原文に対して得られる素性値と、素性重みとを用いて統計的な自動翻訳を行う自動翻訳手段と、 前記複数のドメイン開発セットに記憶された対訳文に対して、前記自動翻訳手段によって得られた翻訳文と参照訳との間の相違を表す値が各ドメインごとに最小になるように、前記汎用統計モデルから得られる素性重みと、前記複数のドメイン開発セットからそれぞれ得られる素性重みとを最適化するためのさらなる最適化手段とを含む、自動翻訳の素性重み最適化装置。
IPC (1件):
G06F 17/28
FI (2件):
G06F17/28 609 ,  G06F17/28 654
Fターム (2件):
5B091CC03 ,  5B091EA01
引用特許:
出願人引用 (2件) 審査官引用 (2件)

前のページに戻る