プレプリント
J-GLOBAL ID:202202209987178761   整理番号:22P0024727

音合成における深層学習のためのオーディオ表現:レビュー【JST・京大機械翻訳】

Audio representations for deep learning in sound synthesis: A review
著者 (2件):
資料名:
発行年: 2022年01月07日  プレプリントサーバーでの情報更新日: 2022年01月07日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
深層学習アルゴリズムの上昇は,音響発生のための古典的信号処理法の利用から,多くの研究者を指導する。深層学習モデルは,仮想機器から表現的音声合成,現実的音テクスチャ,および音楽音を達成した。しかし,最も適切な深層学習アーキテクチャはまだ調査中である。アーキテクチャの選択は,オーディオ表現と緊密に結合されている。音の元の波形は,効率的に,そして,計算量を訓練時間と計算コストを上げるために,深い学習モデルのために,高密度で豊富である。また,それは知覚される方法で音を表現しない。したがって,多くの場合,生オーディオは,アップサンプリング,特徴抽出,または波形の高レベル説明を採用することによって,圧縮され,より意味のある形に変換された。さらに,選択した形式,付加的調整表現,異なるモデルアーキテクチャ,および再構成音を評価するための多数のメトリックスを調べた。本論文では,深層学習を用いた音合成に適用したオーディオ表現の概要を提供した。さらに,音声表現に依存して,深層学習モデルを用いる音合成アーキテクチャを開発し,評価するための最も重要な方法を示す。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識  ,  人工知能 
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る