文献
J-GLOBAL ID:201602259643203594   整理番号:16A0544284

DNNベースのTTS合成のための複数話者のモデル化と話者適応

MULTI-SPEAKER MODELING AND SPEAKER ADAPTATION FOR DNN-BASED TTS SYNTHESIS
著者 (4件):
資料名:
巻: 2015 Vol.6  ページ: 4475-4479  発行年: 2015年 
JST資料番号: E0316B  ISSN: 1520-6149  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本論文では,隠れ層が各話者間で共有されている一方で,回帰層が話者に依存している様な,複数話者ディープニューラルネットワーク(DNN)を提案した。各話者が共有している隠れ層と別々の話者のための回帰層は,複数の話者依存の文書音声読上げ(TTS)コーパスにより合同で訓練した。共有の隠れ層は,任意の話者が使用できるグローバルな言語的特徴変換と見なすことができた。実際に複数話者DNNのアーキテクチャと訓練手順は,マルチタスク学習のインスタンスである。そこでは複数の関連タスクを持つモデルが組み合わされて,それらが共有知識により強化された。また共有の言語的特徴変換は,転送学習により派生した新しい話者に転送することもできた。非常に限られた訓練データのみを持つ新規の話者に対する話者適応は,共有隠れ層を固定し,回帰層を更新することによって達成できた。今後は本提案の方法を,より多くの話者とかなり大きなコーパスに適用して行く。
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (4件):
分類
JSTが定めた文献の分類名称とコードです
音声処理  ,  ニューロコンピュータ  ,  人工知能  ,  聴覚・音声モデル 
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る