文献
J-GLOBAL ID:202202254554130600   整理番号:22A1077654

MSR-NV:複数サンプリングレートを用いたニューラルボコーダの検討

MSR-NV: An investigation of neural vocoder using multiple sampling rates.
著者 (2件):
資料名:
巻: 2022  号: 春季  ページ: ROMBUNNO.1-3-17  発行年: 2022年02月23日 
JST資料番号: G0381C  ISSN: 1880-7658  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
・複数のサンプリングレートを単一のニューラルボコーダ(NV)で扱うための手法とであるMSR(Multiple Sampling Rates)-NVの提案。
・提案手法の有効性を確かめるため,Parallel Wave-GANに基づくモデル構造を提案手法を用いて拡張し,実験的評価を実施。
・実験的評価により,従来の高速な推論速度を保ちながら,48kHzを含む複数のサンプリングレートで高品質な波形生成が行えることを確認。
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
音声処理  ,  人工知能 
引用文献 (22件):
  • A. Oord et al. WaveNet: A generative model for raw audio. arXiv preprint arXiv:1609.03499, Sep. 2016.
  • A. Tamamori et al. Speaker-dependent WaveNet vocoder. In Proc. INTERSPEECH, pp. 1118-1122, Aug. 2017.
  • H. Kawahara et al. Tandem-STRAIGHT: A temporally stable power spectral representation for periodic signals and applications to interference-free spectrum, f0, and aperiodicity estimation. In Proc. ICASSP, pp. 3933-3936, Apr. 2008.
  • M. Morise et al. WORLD: a vocoder-based high-quality speech synthesis system for real-time applications. IEICE Transactions on Information and Systems, 99(7):1877-1884, Jul. 2016.
  • A. Oord et al. Parallel WaveNet: Fast high-fidelity speech synthesis. In Proc. ICML, pp. 3918-3926, Jul. 2018.
もっと見る
タイトルに関連する用語 (1件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る