文献
J-GLOBAL ID:202202265425883735   整理番号:22A0959314

環境音分類のための深層畳込み生成敵対ネットワークを用いたCNN-RNNとデータ増強【JST・京大機械翻訳】

CNN-RNN and Data Augmentation Using Deep Convolutional Generative Adversarial Network for Environmental Sound Classification
著者 (3件):
資料名:
巻: 29  ページ: 682-686  発行年: 2022年 
JST資料番号: W0576A  ISSN: 1070-9908  CODEN: ISPLEM  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
深層学習における深層ニューラルネットワークは,データ特徴を抽出する際に,従来の機械学習法よりも,より高い精度と明確な利点を有することが広く実証されてきた。畳み込みニューラルネットワーク(CNN)は特徴抽出とオーディオ分類において大きな成功を示したが,リアルタイムオーディオは以前のシーンに依存することに注意することが重要である。また,深層学習アルゴリズムの主な欠点は,それらの効率的な性能を示すために膨大な数のデータセットを必要とすることである。本論文では,CNNと組み合わせた再帰ニューラルネットワーク(RNN)を提案し,この問題に対処した。さらに,高品質データ増強のために,深い畳込み生成的ネットワーク(DCGAN)を用いた。このデータ増強技術を,環境音分類を改善するために,都市Sound8Kデータセットに適用した。バッチ正規化,移動学習,および3つの特徴表現マップを用いて,モデル精度を改善した。その結果,DCGANによる生成画像は元の訓練画像と同様の特徴を持ち,スペクトログラムを生成し,分類精度を改善する能力を持つことを示した。都市Sound8Kデータセットに関する実験結果は,提案したCNN-RNNアーキテクチャが最先端の分類モデルよりも優れた性能を達成することを示した。Copyright 2022 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識 

前のページに戻る