文献
J-GLOBAL ID:202002280001315002   整理番号:20A2766581

世界-タコトロンに基づくエンドツーエンド中国語音声合成について【JST・京大機械翻訳】

On End-to-End Chinese Speech Synthesis Based on World-Tacotron
著者 (2件):
資料名:
巻: 2020  号: ICCST  ページ: 538-542  発行年: 2020年 
JST資料番号: W2441A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
近年,エンドツーエンド音声合成モデルであるタコトロンを用いた中国語音声合成において多くの試みが行われている。しかし,タコトロンは,高次元で音響特徴を必要とし,低品質の音声を合成するGrifin-Limアルゴリズムを採用する。Gofifin-Limの代わりにWaveNetを採用して,音声合成の品質を大いに強化するGoogle発射タコトロン2は,しかしながら,WaveNetは質量データで訓練され,遅い合成速度を持っている。上記の問題に関して,著者らは世界-タコトロンを提案し,それはタコトロン2によって最適化されたタコトロンモデルと世界ボコーダを結合した。このスキームは,元のタコトロンの次元を98%(2129から38へ),合成品質を改善した。さらに,世界-タコトロンによって合成された音声の最後での関節は不完全である。したがって,本論文は,前処理におけるトリムを削除することによって,この関節を最適化して,しかし,それはより長い収束期間をもたらした。Copyright 2020 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
図形・画像処理一般 

前のページに戻る