文献
J-GLOBAL ID:202202229468062894   整理番号:22A1077975

キャラクタ分散表現を用いた演じ分けを実現するオーディオブック音声合成

Audiobook Speech Synthesis based on Character embedding for Distinguishable Character Acting
著者 (7件):
資料名:
巻: 2022  号: 春季  ページ: ROMBUNNO.3-3-1  発行年: 2022年02月23日 
JST資料番号: G0381C  ISSN: 1880-7658  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
・キャラクタ演技に着目し,作品内のキャラクタ発話情報からキャラクタ分散表現を抽出し,キャラクタ性内包音声を実現する音声合成モデルの提案。
・キャラクタ分散表現で条件付けしたFastSpeech2音響モデルを用い,Res畳込みニューラルネットワークを用いた合成音声発話内の特徴抽出によるキャラクタごと声質の明示的実現。
・音声合成モデルのキャラクタ分散表現条件付だけでは不十分なこと,トリプレットロスを用いたキャラクタごとに異なる声質明示の必要性の確認。
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
音声処理 
引用文献 (21件):
  • J. Shen et al., “Natural TTS synthesis by conditioning Wavenet on mel spectrogram predictions,” in Proc. ICASSP 2018, 2018, pp. 4779-4783.
  • N. Wataru et al., “Audiobook speech synthesis conditioned by cross-sentence context-aware word embeddings,” in Proc. 11th ISCA Speech Synthesis Workshop (SSW 11), 2021, pp. 211-215.
  • P. Wu et al., “End-to-end emotional speech synthesis using style tokens and semi-supervised training,” in Proc. APSIPA ASC 2019, 2019, pp. 623-627.
  • Y.-J. Zhang et al., “Learning latent representations for style control and transfer in end-to-end speech synthesis,” in Proc. ICASSP 2019, 2019, pp. 6945-6949.
  • J. Pan et al., “A chapter-wise understanding system for text-to-speech in Chinese novels,” in Proc. ICASSP 2021, 2021, pp. 6069-6073.
もっと見る
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る