プレプリント
J-GLOBAL ID:202202217634699043   整理番号:22P0022361

短期特徴の2段階ウィンドウ化を持つ分散ニューラルネットワークに基づく鳥類種分類と音響特徴選択【JST・京大機械翻訳】

Bird Species Classification And Acoustic Features Selection Based on Distributed Neural Network with Two Stage Windowing of Short-Term Features
著者 (1件):
資料名:
発行年: 2022年01月01日  プレプリントサーバーでの情報更新日: 2022年01月01日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
オーディオ記録からの鳥類種の同定は,同じ記録における多重種の存在,背景におけるノイズ,および長期記録により,挑戦的なタスクの1つである。さらに,鳥類種分類のためのオーディオ記録から適切な音響特徴を選択することは別の問題である。本論文では,多様なソースとタイプのオーディオ記録から鳥種を分類するための従来の信号処理と深層学習ベースアプローチの両方から成るハイブリッド法を示した。そのうえ,34の異なる特徴による詳細な研究は,リアルタイムアプリケーションにおける分類と解析のための適切な特徴集合を選択するのを助ける。さらに,提案した深層ニューラルネットワークは音響と時間特徴学習の両方を使用する。提案手法は,生信号から音声活動を検出し,続いて50ms(25ms重複)時間窓を用いて処理記録から短期特徴を抽出する。その後,短期特徴を,2次段階(非重複)ウィンドウを用いて再成形し,分散2D畳込みニューラルネットワーク(CNN)を通して訓練し,出力特徴をLongおよびShort Termメモリ(LSTM)ネットワークに転送する。次に,最終的な高密度層は鳥類種を分類する。10クラス分類器に対して,達成された最高精度は,13のメル周波数セプストラム係数(MFCC)と12のクロマチンベクトルから成る特徴集合に対して90.45%であった。対応する特異性とAUCスコアは,それぞれ98.94%と94.09%であった。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識  ,  人工知能 

前のページに戻る