音合成における深層学習のためのオーディオ表現:レビュー【JST・京大機械翻訳】

Natsiou Anastasia; O'Leary Sean

プレプリント

J-GLOBAL ID：202202209987178761 整理番号：22P0024727

音合成における深層学習のためのオーディオ表現:レビュー【JST・京大機械翻訳】

Audio representations for deep learning in sound synthesis: A review

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (2件)： ,
資料名：
発行年： 2022年01月07日プレプリントサーバーでの情報更新日： 2022年01月07日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

深層学習アルゴリズムの上昇は,音響発生のための古典的信号処理法の利用から,多くの研究者を指導する。深層学習モデルは,仮想機器から表現的音声合成,現実的音テクスチャ,および音楽音を達成した。しかし,最も適切な深層学習アーキテクチャはまだ調査中である。アーキテクチャの選択は,オーディオ表現と緊密に結合されている。音の元の波形は,効率的に,そして,計算量を訓練時間と計算コストを上げるために,深い学習モデルのために,高密度で豊富である。また,それは知覚される方法で音を表現しない。したがって,多くの場合,生オーディオは,アップサンプリング,特徴抽出,または波形の高レベル説明を採用することによって,圧縮され,より意味のある形に変換された。さらに,選択した形式,付加的調整表現,異なるモデルアーキテクチャ,および再構成音を評価するための多数のメトリックスを調べた。本論文では,深層学習を用いた音合成に適用したオーディオ表現の概要を提供した。さらに,音声表現に依存して,深層学習モデルを用いる音合成アーキテクチャを開発し,評価するための最も重要な方法を示す。【JST・京大機械翻訳】

, , , , , , , , , , , ,
, , , 【Automatic Indexing@JST】

パターン認識 , 人工知能

, , , ,

前のページに戻る