短期特徴の2段階ウィンドウ化を持つ分散ニューラルネットワークに基づく鳥類種分類と音響特徴選択【JST・京大機械翻訳】

Hasan Nahian Ibn

プレプリント

J-GLOBAL ID：202202217634699043 整理番号：22P0022361

短期特徴の2段階ウィンドウ化を持つ分散ニューラルネットワークに基づく鳥類種分類と音響特徴選択【JST・京大機械翻訳】

Bird Species Classification And Acoustic Features Selection Based on Distributed Neural Network with Two Stage Windowing of Short-Term Features

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (1件)：
資料名：
発行年： 2022年01月01日プレプリントサーバーでの情報更新日： 2022年01月01日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

オーディオ記録からの鳥類種の同定は,同じ記録における多重種の存在,背景におけるノイズ,および長期記録により,挑戦的なタスクの1つである。さらに,鳥類種分類のためのオーディオ記録から適切な音響特徴を選択することは別の問題である。本論文では,多様なソースとタイプのオーディオ記録から鳥種を分類するための従来の信号処理と深層学習ベースアプローチの両方から成るハイブリッド法を示した。そのうえ,34の異なる特徴による詳細な研究は,リアルタイムアプリケーションにおける分類と解析のための適切な特徴集合を選択するのを助ける。さらに,提案した深層ニューラルネットワークは音響と時間特徴学習の両方を使用する。提案手法は,生信号から音声活動を検出し,続いて50ms(25ms重複)時間窓を用いて処理記録から短期特徴を抽出する。その後,短期特徴を,2次段階(非重複)ウィンドウを用いて再成形し,分散2D畳込みニューラルネットワーク(CNN)を通して訓練し,出力特徴をLongおよびShort Termメモリ(LSTM)ネットワークに転送する。次に,最終的な高密度層は鳥類種を分類する。10クラス分類器に対して,達成された最高精度は,13のメル周波数セプストラム係数(MFCC)と12のクロマチンベクトルから成る特徴集合に対して90.45%であった。対応する特異性とAUCスコアは,それぞれ98.94%と94.09%であった。【JST・京大機械翻訳】

, , , , , , , , , , , , ,
, , 【Automatic Indexing@JST】

パターン認識 , 人工知能

, , , , , ,

前のページに戻る