{{ $t("message.ADVERTISEMENT") }}
{{ $t("message.AD_EXPIRE_DATE") }}2024年03月
文献
J-GLOBAL ID:201702288749801357   整理番号:17A1034891

入力符号を用いたDNNベース音声合成の適用と制御【Powered by NICT】

Adapting and controlling DNN-based speech synthesis using input codes
著者 (4件):
資料名:
巻: 2017  号: ICASSP  ページ: 4905-4909  発行年: 2017年 
JST資料番号: W2441A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
出力音声の特性を適合させると制御のための方法:音声合成における重要な話題である。本研究では,従来のテキスト入力と平行しても入力として話者,性別および年齢コードを,1)プリフォーム複数話者合成するために,2)少量目標話者適応化データを用いた話者適応を行う,3)入力符号に基づく合成音声特性を修飾するDNNベーステキスト音声システムの性能を調べた。十及び八十の間で両性別及び年齢の135人の話者による大規模,スタジオ品質音声コーパスを用いて,三実験を行った1)まず,話者のサブセットを用いた話者符号を用いたDNNベース,複数話者音響モデルを構築した。2)次に,少量適応材料からの逆伝搬による新しい話者のためのコードベクトルを推定することにより,話者適応を行った。3)最後に,合成音声の性別および/または年齢特性を変化させる入力コードベクトルを操作する手動で実験を行った。実験の結果は,高性能多数話者モデルは,様々な符号化方式の提案した符号ベクトルを用いて構築可能であることと,適応と操作は,コードを用いて効率的に実行できることを示した。Copyright 2017 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識  ,  人工知能 
タイトルに関連する用語 (2件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る