cMelGAN:Melスペクトログラムに基づく効率的な条件付き生成モデル【JST・京大機械翻訳】

Qian Tracy; Kaunismaa Jackson; Chung Tony

プレプリント

J-GLOBAL ID：202202204722347055 整理番号：22P0350406

cMelGAN:Melスペクトログラムに基づく効率的な条件付き生成モデル【JST・京大機械翻訳】

cMelGAN: An Efficient Conditional Generative Model Based on Mel Spectrograms

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (3件)： , ,
資料名：
発行年： 2022年05月15日プレプリントサーバーでの情報更新日： 2022年05月15日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

機械学習の分野における音楽は,多くの制約を持つ非常に困難な問題である。オーディオデータの性質は,その非常に高い次元と構造的に変化するスケールを持ち,それがモデル化するのが難しい主な理由の1つである。音楽,条件付き音楽生成,または人気予測の区分の分類のような音楽における機械学習の多くの応用がある。このプロジェクトの目的は,Melスペクトログラムに基づく音楽のジャンル条件生成モデルを開発することであり,ノートベース表現を使用する既存の生成音楽モデルと比較してその性能を評価することである。最初に,MelNetと呼ばれる自己回帰,RNNベース生成モデルを実行した。しかしながら,その遅い速度と低い忠実度出力のため,著者らは,cMelGANと呼ばれる,MelGAN[4]と条件付きGANアーキテクチャに基づく,新しい完全畳込みアーキテクチャを作成することを決定した。【JST・京大機械翻訳】

, , , , , , ,
, , , , 【Automatic Indexing@JST】

楽器音響

前のページに戻る