文献
J-GLOBAL ID:202102244593559954   整理番号:21A0958883

アクセント句を考慮した日本語End-to-End音声合成サーバの構築

Developing a Japanese End-to-End Speech Synthesis Server Considering Accent Phrases.
著者 (3件):
資料名:
巻: 2021  号: 春季  ページ: ROMBUNNO.1-2-7  発行年: 2021年02月24日 
JST資料番号: G0381C  ISSN: 1880-7658  資料種別: 会議録 (C)
記事区分: 短報  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
・End-to-End音声合成器の入力ラベル列にアクセントの情報を明示的に加えることで合成音声のイントネーションの自然さを改善する手法とそのサーバ実装について記述。
・提案手法では,各音素ラベルの直後に,「アクセント句のアクセント型」と「アクセント核までの距離(音節数)」をそれぞれ表す2種類の整数ラベルを追加。
・本サーバでは,合成音声の波形情報だけでなく,合成音声中の各音素の時刻情報も併せて送信されるため,CGアバターやヒューマノイドロボットのリップシンクに用いることも可能。
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
音声処理 
引用文献 (8件):
  • 北岡 教英他, “フォトリアル CG エージェントとのマルチモーダル対話システムの構築”, 日本音響学会春季講論集, 1-2-6, 4pages, 2021.
  • Jonathan Shen et al., “Natural TTS synthesis by conditioning WaveNet on mel spectrogram predictions”, Proc. ICASSP, pp.4779-4783, 2018.
  • Yusuke Yasuda et al., “Investigation of enhanced Tacotron text-to-speech synthesis systems with self-attention for pitch accent language”, Proc. ICASSP, pp.6905-6909, 2019.
  • Tomoki Hayashi et al., “Espnet-TTS: Unified, reproducible, and integratable open source end-to-end text-to-speech toolkit”, Proc. ICASSP, pp.7654-7658, 2020.
  • Ryosuke Sonobe et al., “JSUT corpus: free large-scale Japanese speech corpus for end-to-end speech synthesis”, arXiv preprint, 1711.00354, 2017.
もっと見る
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る