文献
J-GLOBAL ID:202202273793925128   整理番号:22A1066812

アクセント潜在変数を用いた方言音声合成における文単位生成の評価

Evaluation of sentence-level generation in Japanese dialect speech synthesis using accent latent variables
著者 (4件):
資料名:
巻: 121  号: 383(EA2021 64-97)  ページ: 96-101 (WEB ONLY)  発行年: 2022年02月22日 
JST資料番号: U2030A  ISSN: 2432-6380  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
日本語方言音声合成は個人化された音声合成システムなどにとって有用であるが,アクセントラベルを用意できないことが合成音声の自然性を高める上での障害となっている.著者らは過去,アクセントラベルなしで日本語方言のピッチアクセントを生成するため,vector quantized variational autoencoder(VQ-VAE)を用いて方言ピッチアクセントをモーラ単位のアクセント潜在変数としてモデル化する手法を提案し,フレーズ単位の発話に対して評価を行った.これに続き本稿では,修正した同様の手法を文単位の方言発話に適用し,その評価を行う.実験では,文単位発話に対してもアクセント潜在変数によって音声のピッチアクセントをモデル化できること,単語分割の精度が高い場合に提案法は従来法よりも自然なピッチアクセントをテキストから生成できること,提案法によって生成されるピッチアクセントの可制御性が向上することを示す.(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
音声処理 
引用文献 (13件):
  • Yasuda et al. Investigation of learning abilities on linguistic features in sequence-to-sequence text-to-speech synthesis. Computer Speech & Language, Vol. 67, p. 101183, 2021.
  • Open JTalk. http://open-jtalk.sp.nitech.ac.jp/.
  • van den Oord et al. Neural Discrete Representation Learning. In NeurIPS, p. 6309-6318, 2017.
  • Yufune et al. Accent modeling of low-resourced dialect in pitch accent language using variational autoencoder. In ISCA SSW 11, pp. 189-194, 2021.
  • Xin Wang, Shinji Takaki, Junichi Yamagishi, Simon King, and Keiichi Tokuda. A vector quantized variational autoencoder (vq-vae) autoregressive neural f_0 model for statistical parametric speech synthesis. IEEE/ACM Transactions on Audio, Speech, and Language Processing, Vol. 28, pp.157-170, 2019.
もっと見る

前のページに戻る