文献
J-GLOBAL ID:202102232495976479   整理番号:21A0577780

環境音認識における深層ニューラルネットワークの応用と改善【JST・京大機械翻訳】

The Application and Improvement of Deep Neural Networks in Environmental Sound Recognition
著者 (5件):
資料名:
巻: 10  号: 17  ページ: 5965  発行年: 2020年 
JST資料番号: U7135A  ISSN: 2076-3417  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: スイス (CHE)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
ニューラルネットワークは音認識において大きな結果を達成し,ネットワークに対する訓練入力として多くの異なる種類の音響特徴が試みられている。しかし,ニューラルネットワークが生音声信号入力から特徴を効率的に抽出できるかどうかについてはまだ疑問がある。本研究は,より深いネットワークアーキテクチャを用いて,他の研究からの生信号入力ネットワークを改善した。生信号を,提案したネットワークにおいてよりよく分析することができた。また,いくつかの種類のネットワーク設定の議論を提示し,スペクトログラム様変換で,著者らのネットワークは,環境音分類50(ESC50)のためのオープンアウドーデータセットにおいて73.55%の精度に達することができた。本研究はまた,異なる特徴を持つ異なる種類のネットワークフィードを結合できるネットワークアーキテクチャを提案した。グローバルプール化の助けを借りて,柔軟な融合方法をネットワークに統合した。著者らの実験は,異なるオーディオ特徴入力(生音声信号と対数-melスペクトル)を有する2つの異なるネットワークを首尾よく結合した。上記の設定を用いて,提案した並列Netは最終的にESC50において81.55%の精度に達し,それはまた人間の認識レベルに達した。Copyright 2021 The Author(s) All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識 
引用文献 (41件):
  • Chen, J.; Cham, A.H.; Zhang, J.; Liu, N.; Shue, L. Bathroom Activity Monitoring Based on Sound. In Proceedings of the International Conference on Pervasive Computing, Munich, Germany, 8-13 May 2005.
  • Weninger, F.; Schuller, B. Audio Recognition in the Wild: Static and Dynamic Classification on a Real-World Database of Animal Vocalizations. In Proceedings of the Acoustics, Speech and Signal Processing (ICASSP) 2011 IEEE International Conference, Prague, Czech, 22-27 May 2011.
  • Clavel, C.; Ehrette, T.; Richard, G. Events detection for an audio-based Surveillance system. In Proceedings of the ICME 2005 IEEE International Conference Multimedia and Expo., Amsterdam, The Netherlands, 6-8 July 2005.
  • Bugalho, M.; Portelo, J.; Trancoso, I.; Pellegrini, T.; Abad, A. Detecting Audio Events for Semantic Video search. In Proceedings of the Tenth Annual Conference of the International Speech Communication Association, Bighton, UK, 6-9 September 2009.
  • Mohamed, A.-R.; Hinton, G.; Penn, G. Understanding how deep Belief Networks Perform Acoustic Modelling. In Proceedings of the Acoustics, Speech and Signal Processing (ICASSP), 2012 IEEE International Conference, Kyoto, Japan, 23 April 2012.
もっと見る
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る