大量に多言語のグラフームから音素への変換のためのByT5モデル【JST・京大機械翻訳】

Zhu Jian; Zhang Cong; Jurgens David

プレプリント

J-GLOBAL ID：202202206058257496 整理番号：22P0327489

大量に多言語のグラフームから音素への変換のためのByT5モデル【JST・京大機械翻訳】

ByT5 model for massively multilingual grapheme-to-phoneme conversion

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (3件)： , ,
資料名：
発行年： 2022年04月06日プレプリントサーバーでの情報更新日： 2022年07月04日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

本研究では,ByT5に基づくG2Pモデルを実行することにより,大規模多言語グラフmem-to-foneme変換に取り組んだ。著者らは,ByT5に基づく100言語と訓練された大規模多言語G2Pモデルをカバーする様々な情報源からG2Pデータセットを縮小した。バイトレベル入力で動作するByT5は,多言語G2Pに関してトークンベースmT5モデルよりも著しく優れていることを見出した。これらの言語におけるモノリンガルモデルとのペアワイズ比較は,多言語ByT5モデルが様々な言語から共同学習することにより,一般的に音誤り率を低くすることを示唆する。事前訓練モデルは,非意味言語に関するゼロショット予測を通して,低資源G2Pをさらに有利にし,微調整のために事前訓練された重みを提供し,それは,モデルがランダムに初期化された重みより低音誤り率に収束するのを助ける。多言語G2Pに関する将来の研究を促進するために,著者らは,著者らのコードと事前訓練された多言語G2Pモデルをhttps://github.com/lingjzhu/CharsiuG2Pで作成する。【JST・京大機械翻訳】

, , , , ,
, , , 【Automatic Indexing@JST】

パターン認識

, ,

前のページに戻る