文献
J-GLOBAL ID:201602219316840165   整理番号:16A0544281

マルチタスク学習を使用したディープニューラルネットワークと音声合成のために積み重ねられたボトルネックの特性

DEEP NEURAL NETWORKS EMPLOYING MULTI-TASK LEARNING AND STACKED BOTTLENECK FEATURES FOR SPEECH SYNTHESIS
著者 (4件):
資料名:
巻: 2015 Vol.6  ページ: 4460-4464  発行年: 2015年 
JST資料番号: E0316B  ISSN: 1520-6149  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本論文では,訓練中に追加の監督を提供するための簡単で便利な方法として,DNNベースの音声合成におけるマルチタスク学習の使用を提案した。これにより,残念ながら非可逆ではあるが,知覚的に目立った音声表現の使用が可能となった。客観的な結果から,いくつかの異なる2次タスクが全て有用であったが,その中でも周波数・時間的励振パターン(STEP)と呼ばれる知覚的表現が最も有望であることが示唆された。追加のコンテクストを提供するために,本論文では積み重ねられたボトルネックの特性を利用することを提案し,客観的指標から非常に有効であることを明らかにした。聞き取り試験の結果から,マルチタスク学習によっていくつかの改善が得られたが,主観的評価からは大幅な改善は観察されなかった。またボトルネックの特性を積み重ねることで,合成音声の自然さに対する統計的に重要な改善が得られた。そこでは2次タスクの選択が重要であり,それが主要タスクの性能に影響を与えた。
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (4件):
分類
JSTが定めた文献の分類名称とコードです
音声処理  ,  ニューロコンピュータ  ,  人工知能  ,  聴覚・音声モデル 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る