文献
J-GLOBAL ID:201402261706643133   整理番号:14A1265266

パラメトリックTTS合成に対する深層ニューラル・ネットワーク(DNN)の訓練局面について

ON THE TRAINING ASPECTS OF DEEP NEURAL NETWORK (DNN) FOR PARAMETRIC TTS SYNTHESIS
著者 (4件):
資料名:
巻: 2014 Vol.5  ページ: 3829-3833  発行年: 2014年 
JST資料番号: E0316B  ISSN: 1520-6149  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
近年,深層ニューラル・ネットワーク(DNN)という機械学習アルゴリズムが,音声認識の性能を改善している。本論文では,テキスト・ツー・スピーチ(TTS)合成に対する生成モデルとしてのDNNの種々の訓練局面を考察した。データベースには,女性話者の5hrコーパスという中程度サイズのものを用いた。実験結果から,DNNは最大ゆう度(ML)で訓練され次に最小生成誤差(MGE)で精緻化される従来型隠れMarkovモデル(HMM)より性能がよいことが分かった。改善点は主として韻律面であり,これはDNNが有効な特徴相関を利用できるためである考えられる。また,実験結果から以下が明らかとなった。1)訓練の出発点は層ごとの誤差逆伝搬(BP)事前学習で改善される,2)状態境界情報がDNN訓練に大切である,3)DNN隠れ層中の活性化関数としては双曲線正接がシグモイド関数よりも速く収束する。
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
音声処理  ,  自然語処理 
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る