層ワイズ発生訓練のある深部ニューラルネットワークによる音声変換

CHEN Ling-Hui; LING Zhen-Hua; LIU Li-Juan; DAI Li-Rong

文献

J-GLOBAL ID：201502262968452600 整理番号：15A0172001

層ワイズ発生訓練のある深部ニューラルネットワークによる音声変換

Voice Conversion Using Deep Neural Networks With Layer-Wise Generative Training

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=15A0172001&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=15A0172001&from=J-GLOBAL&jstjournalNo=W0508B") }}

著者 (4件)： , , ,
資料名：
巻： 22 号： 11/12 ページ： 1859-1872 発行年： 2014年11月
JST資料番号： W0508B ISSN： 2329-9290 CODEN： ITASFA 資料種別：逐次刊行物 (A)
記事区分：原著論文発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

音源および対象話者のスペクトルエンベロープの間の写像関係を構成するように深部ニューラルネットワーク(DNNs)による新しいスペクトルエンベロープ変換方法を提案した。提案の四層DNNはBernouli双方向連想メモリ(BAM)(BBAM)と二つの制約Boltzmannマシン(RBMs)のカスケードから層ごとに訓練された。RBMsを利用して音源および対象話者のスペクトルエンベロープの分布をモデル化した。BBAMを使用して二つのRBMsから抽出された隠れ変数の接合分布をモデル化した。音声変換中に,出力スペクトルエンベロープの条件付き分布は層毎に得られ,得られた条件付き分布は単一Gauss分布により近似された。

, , , , , , , , , , , , ,

音声処理

, , ,

前のページに戻る