文献
J-GLOBAL ID:202002226737663795   整理番号:20A2710404

ニューラルネットワークスペクトルマッピングモデルとWaveNetボコーダによる音声変換の評価【JST・京大機械翻訳】

An evaluation of voice conversion with neural network spectral mapping models and WaveNet vocoder
著者 (5件):
資料名:
巻:ページ: e26  発行年: 2020年 
JST資料番号: W5440A  ISSN: 2048-7703  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: イギリス (GBR)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本論文は,スペクトルマッピングと波形生成のためのニューラルネットワーク(NN)ベースの統計モデルによる並列音声変換(VC)の評価を提示する。スペクトルマッピングのためのNNベースのアーキテクチャは,深いNN(DNN),深い混合密度ネットワーク(DMDN),および再発性NN(RNN)モデルを含む。高品質NNベース波形生成として,WaveNet(WN)ボコーダを採用した。VCでは,推定音声パラメータの過剰平滑化特性のため,品質劣化は依然として発生する。この問題に取り組むために,著者らは,直接波形モディファイアとグローバル分散ポストフィルタに基づく変換された特徴のためのポスト変換を利用する。ポスト変換との整合性を保つために,スペクトルモデリングのためのスペクトル微分損失を提案した。実験結果は以下を示した。(1)RNNベースのスペクトルモデリングは,DNN/DMDNベースのモデルと比較して,より速い収束速度とより良い一般化でより高い精度を達成する。(2)RNNベースのスペクトルモデリングは,また,平滑化したスペクトル軌跡を少なくできる。(3)提案したスペクトル微分損失の使用は,同じ性変換における性能を改善した。(4)VCにおけるWNボコーダのための変換された特徴に関する提案されたポストコンバージョンは,WNボコーダの従来の使用と比較して,自然性と話者類似性の両方で最良の性能をもたらす。Please refer to the publisher for the copyright holders. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
音声処理 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る