Pat
J-GLOBAL ID:201603006741761113

翻訳学習装置、方法、及びプログラム

Inventor:
Applicant, Patent owner:
Agent (1): 特許業務法人太陽国際特許事務所
Gazette classification:公開公報
Application number (International application number):2015007131
Publication number (International publication number):2016133920
Application date: Jan. 16, 2015
Publication date: Jul. 25, 2016
Summary:
【課題】精度良く、自然言語文を論理形式文に翻訳するための翻訳モデルを学習することができる。【解決手段】自然言語文間翻訳モデル学習部28で自然言語文間翻訳モデル60を学習し、単語アラインメント推定部30で単語アラインメント32を推定し、単語複製部34で推定された単語アラインメント32に基づいて、複製済単語アラインメント36を生成すると共に、複製された単語数に基づいて、単語複製モデル62を学習し、半教師ありフレーズ推定部38で複製済単語アラインメント36に基づいて、フレーズテーブル40を推定し、フレーズフィルタリング部42で、フィルタリング済フレーズテーブル44を得て、翻訳モデル学習部46でフィルタリング済フレーズテーブル44に基づいて、自然言語文を論理形式文に翻訳するための翻訳モデル48を学習し、パラフレージング適用部50でパラフレーズ済翻訳モデルを生成する。【選択図】図1
Claim (excerpt):
入力された、翻訳元言語文と、前記翻訳元言語文に対応する翻訳先言語文とのペアの集合に基づいて、前記翻訳元言語文及び前記翻訳先言語文のペアの各々について、前記翻訳元言語文の単語と前記翻訳先言語文の単語との対応付けである単語アラインメントを推定する単語アラインメント推定部と、 前記単語アラインメント推定部により推定された前記単語アラインメントに基づいて、前記翻訳元言語文及び前記翻訳先言語文のペアの各々について、前記ペアの前記単語アラインメントにおいて、前記翻訳元言語文の1つの単語が、前記翻訳先言語文の複数の部分文字列に対応し、かつ、前記複数の部分文字列が同一又は類似している場合、前記1つの単語を複製した前記翻訳元言語文の単語と前記翻訳先言語文の単語との対応付けである複製済単語アラインメントを生成すると共に、前記翻訳元言語文の単語の各々について複製された単語数に基づいて、前記翻訳元言語文の単語の複製数を推定するための単語複製モデルを学習する単語複製部と、 前記翻訳元言語文及び前記翻訳先言語文のペアの各々について前記単語複製部により生成された前記複製済単語アラインメントに基づいて、前記翻訳元言語文を前記翻訳先言語文に翻訳するための翻訳モデルを学習する翻訳モデル学習部と、 を含む翻訳学習装置。
IPC (1):
G06F 17/28
FI (2):
G06F17/28 618 ,  G06F17/28 627
F-Term (2):
5B091BA11 ,  5B091EA01
Patent cited by the Patent:
Cited by applicant (3) Cited by examiner (3)

Return to Previous Page