文献
J-GLOBAL ID:202202262493374580   整理番号:22A1077645

Period-HiFi-GAN:基本周波数を制御可能な高速ニューラルボコーダ

Period-HiFi-GAN: Fast and fundamental frequency controllable neural vocoder
著者 (8件):
資料名:
巻: 2022  号: 春季  ページ: ROMBUNNO.1-3-8  発行年: 2022年02月23日 
JST資料番号: G0381C  ISSN: 1880-7658  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
・基本周波数を制御可能な高速かつ高品質ニューラルボコーダ実現のため,HiFi-GANに新たに励起信号を入力するネットワークを導入したPeriod-HiFi-GANの提案。
・未知話者音声の分析合成,および基本周波数をスケーリングした場合についての評価実験を行い提案法の性能を評価。
・男性音声の合成及び低い基本周波数の合成において従来法を上回る品質を提案法によって達成。
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
音声処理  ,  人工知能 
引用文献 (15件):
  • J. Shen et al., “Neural TTS synthesis by conditioning WavaNet on mel spectrogram predictions,” in Proc. ICASSP,Apr. 2018,pp. 4779-4783.
  • A. Tamamori et al., “Speaker-dependent WaveNet vocoder,” in Proc. Interspeech,Aug. 2017,pp. 1118-1122.
  • M. Morise et al., “WORLD: a vocoder-based high-quality speech synthesis system for real-time applications,” IEICE trans, Inf. Syst., vol. E99-D,no. 7,pp. 1877-1884,2016.
  • I. Goodfellow et al., “Generative adversarial nets,” in Proc NIPS.,Dec. 2014, pp. 2672-2680.
  • R. Yamamoto et al., “Parallel WaveGAN:a fast Waveform generation model based on generative adversarial networks with multi-resolution spectrogram,” in Proc. ICASSP, May 2020, pp. 6199-6203.
もっと見る
タイトルに関連する用語 (2件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る