特許
J-GLOBAL ID:201703019559688100

文字列対応付け装置、方法、及びプログラム

発明者:
出願人/特許権者:
代理人 (1件): 特許業務法人太陽国際特許事務所
公報種別:特許公報
出願番号(国際出願番号):特願2013-149869
公開番号(公開出願番号):特開2015-022508
特許番号:特許第6044996号
出願日: 2013年07月18日
公開日(公表日): 2015年02月02日
請求項(抜粋):
【請求項1】 異なる第1の言語及び第2の言語にそれぞれ属する同じ意味の文字列の組み合わせである文字列組について、前記第1の言語の文字列と、前記第2の言語の文字列との間で文字の対応付けを行う文字列対応付け装置であって、 前記文字列組を複数組記憶した文字列組データベースに記憶された前記文字列組の各々に対して、前記文字列組の各文字列を、前記文字列の先頭から順番に、他方の言語の部分文字列と翻字関係にない0文字以上の部分文字列を示す前置非翻字セグメントと、前記他方の言語の部分文字列と翻字関係にある0文字以上の部分文字列を示す翻字セグメントと、前記他方の言語の部分文字列と翻字関係にない0文字以上の部分文字列を示す後置非翻字セグメントとで構成したときに、前記第1の言語の部分文字列が、前記第2の言語の部分文字列と翻字関係にない非翻字部分である確率を表す非翻字モデル選択確率と、前記第2の言語の部分文字列が、前記第1の言語の部分文字列と翻字関係にない非翻字部分である確率を表す非翻字モデル選択確率と、前記第1の言語の部分文字列が、前記第2の言語の部分文字列と翻字関係にある翻字部分であり、かつ前記第2の言語の部分文字列が、前記第1の言語の部分文字列と翻字関係にある翻字部分である確率を表す翻字モデル選択確率と、前記第1の言語の文字列のうちの前記前置非翻字セグメントの部分文字列、及び前記後置非翻字セグメントの部分文字列の各々に対する前記第1の言語における生成確率を表す非翻字モデル生成確率と、前記第2の言語の文字列のうちの前記前置非翻字セグメントの部分文字列、及び前記後置非翻字セグメントの部分文字列の各々に対する前記第2の言語における生成確率を表す非翻字モデル生成確率と、前記第1の言語の文字列のうちの前記翻字セグメントの部分文字列と、前記第2の言語の文字列のうちの前記翻字セグメントの部分文字列との間の部分文字列の各ペアに対する同時生成確率を表す翻字モデル生成確率と、に基づいて尤もらしくなるように、前記文字列組の各文字列を前記前置非翻字セグメント、前記翻字セグメント、及び後置非翻字セグメントで構成し、かつ、前記第1の言語の文字列のうちの前記翻字セグメントの部分文字列と、前記第2の言語の文字列のうちの前記翻字セグメントの部分文字列との間で文字の対応付けを行う対応付け計算部 を含み、 前記対応付け計算部は、 前記第1の言語の前記非翻字モデル選択確率と、前記第2の言語の前記非翻字モデル選択確率と、前記第2の言語の各部分文字列に対する前記翻字モデル選択確率と、前記第1の言語の各部分文字列に対する前記非翻字モデル生成確率と、前記第2の言語の各部分文字列に対する前記非翻字モデル生成確率と、前記第1の言語の部分文字列と前記第2の言語の部分文字列との間の部分文字列の各ペアに対する前記翻字モデル生成確率と、に対して初期値を各々設定する初期値設定部と、 前記初期値設定部によって設定され、又は前回更新された、前記非翻字モデル選択確率、前記翻字モデル選択確率、前記非翻字モデル生成確率、及び前記翻字モデル生成確率に基づいて、前記文字列組の各々に対して、前記第1の言語の文字列のうちの部分文字列と、前記第2の言語の文字列のうちの部分文字列との間の部分文字列の各ペアについて、前記ペアが翻訳関係にある期待値を計算し、前記第1の言語の文字列のうちの各部分文字列について、前記部分文字列が非翻字部分である期待値を計算し、前記第2の言語の文字列のうちの各部分文字列について、前記部分文字列が非翻字部分である期待値を計算する期待値計算部と、 前記文字列組の各々に対して前記期待値計算部によって計算された各ペアに対する前記翻訳関係にある期待値、前記第1の言語の各部分文字列についての前記非翻字部分である期待値、及び前記第2の言語の各部分文字列についての前記非翻字部分である期待値に基づいて、前記非翻字モデル選択確率、前記翻字モデル選択確率、前記非翻字モデル生成確率、及び前記翻字モデル生成確率を更新するパラメータ更新部と、 予め定められた停止条件が満たされたか否かを判定し、前記停止条件が満たされるまで、前記期待値計算部による計算、及び前記パラメータ更新部による更新を繰り返す停止条件判定部と、を含み 前記文字列組の各々に対して、前記非翻字モデル選択確率、前記翻字モデル選択確率、前記非翻字モデル生成確率、及び前記翻字モデル生成確率の各々に基づいて、前記文字列組の各文字列を前記前置非翻字セグメント、前記翻字セグメント、及び後置非翻字セグメントで構成し、かつ、前記第1の言語の文字列のうちの前記翻字セグメントの部分文字列と、前記第2の言語の文字列のうちの前記翻字セグメントの部分文字列との間で文字の対応付けを行う文字列対応付け装置。
IPC (1件):
G06F 17/28 ( 200 6.01)
FI (1件):
G06F 17/28 627
引用特許:
審査官引用 (5件)
全件表示

前のページに戻る