抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本稿では,統語情報に基づく機械翻訳の翻訳性能を向上させるため,ノンパラメトリックベイズ法により,単語間の係り受け構造から各単語の品詞を推定する手法を提案する。提案手法は,単言語における無限ツリーモデル(Infinite Tree Model)を,原言語と目的言語の両言語を考慮するバイリンガルなシナリオに拡張した手法である。提案モデルでは,原言語の係り受け木における各品詞を隠れ状態とし,各隠れ状態は,原言語の単語とともに,対応する目的言語の単語をシンボルとして出力する。本稿では,原言語の単語と目的言語の単語を結合させて出力する「結合モデル」と,別々に出力する「独立モデル」を提案する。NTCIR-9の日英特許翻訳タスクにおける評価実験を通じて,提案手法により推定した日本語の品詞タグを使うことにより,forest-to-string翻訳システムの性能を改善できることを示す。また,独立モデルは,結合モデルが抱えるシンボルのスパースネス問題を解決し,既存の品詞を使う従来の翻訳よりもBLEUで1%以上性能を改善できることを示す。(著者抄録)