特許
J-GLOBAL ID:201303031927697735

並べ替えモデル学習装置、方法、及びプログラム、並びに翻訳装置、方法、及びプログラム

発明者:
出願人/特許権者:
代理人 (1件): 特許業務法人太陽国際特許事務所
公報種別:公開公報
出願番号(国際出願番号):特願2012-123392
公開番号(公開出願番号):特開2013-250652
出願日: 2012年05月30日
公開日(公表日): 2013年12月12日
要約:
【課題】構文解析の誤りの影響を抑制し、高精度な並べ替えを行うための並べ替えモデルを学習する。【解決手段】入力文解析部54で、翻訳元言語で記述された入力文を解析して、複数の構文木を内包し、かつ各ノードに文法カテゴリや品詞情報等の詳細な文法情報が付与された構文森を作成する。並べ替え部56で、翻訳元言語の構文森34に含まれる部分木の構造、単語対応付け結果40に基づく子ノードの並べ替えの要否、並びに部分木に含まれる全てのノード及び親ノードの全ての親ノードの各々に付与された文法情報の各々からなる素性集合の組を並べ替え訓練データとして用いて学習された並べ替えモデル42と、入力文の構文森の各部分木から抽出される素性集合とに基づいて、入力文の構文森に含まれる各部分木の子ノードを並べ替えることにより入力文を並べ替え、翻訳処理部58で、並べ替えた入力文を翻訳モデル46に基づいて、翻訳先言語に翻訳する。【選択図】図1
請求項(抜粋):
翻訳元言語で記述された学習用翻訳元文を構文解析して、該学習用翻訳元文が、複数の構文木を内包し、かつ各ノードに少なくとも文法カテゴリ及び品詞情報を含む文法情報が付与された構文森で表現された解析結果を得る翻訳元解析手段と、 前記翻訳元解析手段で得られた構文森に含まれる親ノード及び複数の子ノードを有する部分木の構造、翻訳元言語と翻訳先言語との単語対応付け結果に基づいて判定された該部分木の複数の子ノードの並べ替えの要否を示す情報、並びに前記部分木に含まれるノード及び該部分木に含まれる親ノードの親ノードの全てまたは一部のノードの各々に付与された前記文法情報の各々からなる素性集合の組を訓練データとして前記構文森に含まれる部分木毎に抽出し、抽出した複数の訓練データを用いて、部分木の複数の子ノードの並べ替えの要否を判定するための並べ替えモデルを学習する学習手段と、 を含む並べ替えモデル学習装置。
IPC (1件):
G06F 17/28
FI (1件):
G06F17/28 P
Fターム (5件):
5B091AA07 ,  5B091BA03 ,  5B091BA11 ,  5B091CA21 ,  5B091EA01

前のページに戻る