文献
J-GLOBAL ID:201502262968452600   整理番号:15A0172001

層ワイズ発生訓練のある深部ニューラルネットワークによる音声変換

Voice Conversion Using Deep Neural Networks With Layer-Wise Generative Training
著者 (4件):
資料名:
巻: 22  号: 11/12  ページ: 1859-1872  発行年: 2014年11月 
JST資料番号: W0508B  ISSN: 2329-9290  CODEN: ITASFA  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
音源および対象話者のスペクトルエンベロープの間の写像関係を構成するように深部ニューラルネットワーク(DNNs)による新しいスペクトルエンベロープ変換方法を提案した。提案の四層DNNはBernouli双方向連想メモリ(BAM)(BBAM)と二つの制約Boltzmannマシン(RBMs)のカスケードから層ごとに訓練された。RBMsを利用して音源および対象話者のスペクトルエンベロープの分布をモデル化した。BBAMを使用して二つのRBMsから抽出された隠れ変数の接合分布をモデル化した。音声変換中に,出力スペクトルエンベロープの条件付き分布は層毎に得られ,得られた条件付き分布は単一Gauss分布により近似された。
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
音声処理 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る