文献
J-GLOBAL ID:201702264483662116   整理番号:17A0142589

大規模合成した並列コーパスに基づく音声変換ディープニューラルネットワーク【Powered by NICT】

Deep neural network based voice conversion with a large synthesized parallel corpus
著者 (4件):
資料名:
巻: 2016  号: APSIPA  ページ: 1-5  発行年: 2016年 
JST資料番号: W2441A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
ソース話者の音声特徴を地図化ディープニューラルネットワーク(DNNs)に基づくターゲット話者への声質変換フレームワークを提案した。対ソースとターゲット話者のに必要な並列データの限られたアベイラビリティに由来して,音声合成と動的時間ワーピングは,DNN訓練のための大規模並列コーパスを構築するために利用した。DNNを訓練するために小さなコーパスを,より低い対数スペクトル歪はまだ従来のGauss混合モデル(GMM)アプローチ,同じデータを用いて訓練された上で見ることができる。合成した対訳コーパスを用いて,小さな対比コーパスからDNN変換音声と比較した場合,大きな並列コーパスからDNN変換音声で観察された約54.5%対32.8%の音声の自然さ嗜好スコアと約52.5%vs.23.6%の音声類似性嗜好スコア。Copyright 2017 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
音声処理 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る