DNN音声合成におけるスタイル付与モデル学習法の検討

蛭田宜樹; 郡山知樹; 太刀岡勇気; 小林隆夫

文献

J-GLOBAL ID：201902215895006827 整理番号：19A1929200

DNN音声合成におけるスタイル付与モデル学習法の検討

A study on style transplantation modeling techniques for DNN-based speech synthesis

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=19A1929200&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=19A1929200&from=J-GLOBAL&jstjournalNo=S0532B") }}

著者 (4件)： , , ,
資料名：
巻： 119 号： 80(SP2019 1-5)(Web) ページ： 1-6 (WEB ONLY) 発行年： 2019年06月06日
JST資料番号： S0532B ISSN： 0913-5685 資料種別：会議録 (C)
記事区分：原著論文発行国：日本 (JPN) 言語：日本語 (JA)

本報告ではDNN音声合成におけるスタイル付与手法について検討している.スタイル付与とは,音声を合成したい話者(目標話者)のモデル学習用音声として読上げ音声のみが与えられた場合に,その話者の表現豊かな音声を合成する技術である.本報告では目標話者の読上げ音声が少量しか与えられていない状況を想定し,i-vectorをDNNの入力として用いる二つのモデルについて評価検討している.提案手法の基本的な枠組みは従来手法と同様,複数話者の多様な表現を持つ音声を用いて話者性とスタイルを制御可能なモデルを構築することであり,提案法ではi-vectorを合成音声の話者性を制御するためのDNNの入力として用いている.提案モデルの効果を確認するため客観及び主観評価実験を行い,提案スタイル付与手法とone-hot表現の話者コードをDNNの入力として用いる従来モデルとの比較評価結果を示す.(著者抄録)

, , , , , , ,
, , ,

音声処理

引用文献 (15件)：

H. Zen, A. Senior, and M. Schuster, “Statistical parametric speech synthesis using deep neural networks,” 2013 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), pp.7962-7966, 2013.
K. Tokuda, T. Yoshimura, T. Masuko, T. Kobayashi, and T. Kitamura, “Speech parameter generation algorithms for HMM-based speech synthesis,” 2000 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), pp.1315-1318, 2000.
H. Zen, K. Tokuda, T. Masuko, T. Kobayashi, and T. Kitamura, “Hidden Semi-Markov Model Based Speech Synthesis,” Proc. INTERSPEECH, pp.1393-1396, 2004.
H. Kanagawa, T. Nose, and T. Kobayashi, “Speaker-independent style conversion for HMM-based expressive speech synthesis,” 2013 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), pp.7864-7868, 2013.
J. Lorenzo-Trueba, R. Barra-Chicote, J. Yamagishi, O. Watts, and J. Montero, “Towards Speaking Style Transplantation in Speech Synthesis,” Proc. SSW8, pp.159-163, 2013.

, ,

前のページに戻る