抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
オーディオ記録からの鳥類種の同定は,同じ記録における多重種の存在,背景におけるノイズ,および長期記録により,挑戦的なタスクの1つである。さらに,鳥類種分類のためのオーディオ記録から適切な音響特徴を選択することは別の問題である。本論文では,多様なソースとタイプのオーディオ記録から鳥種を分類するための従来の信号処理と深層学習ベースアプローチの両方から成るハイブリッド法を示した。そのうえ,34の異なる特徴による詳細な研究は,リアルタイムアプリケーションにおける分類と解析のための適切な特徴集合を選択するのを助ける。さらに,提案した深層ニューラルネットワークは音響と時間特徴学習の両方を使用する。提案手法は,生信号から音声活動を検出し,続いて50ms(25ms重複)時間窓を用いて処理記録から短期特徴を抽出する。その後,短期特徴を,2次段階(非重複)ウィンドウを用いて再成形し,分散2D畳込みニューラルネットワーク(CNN)を通して訓練し,出力特徴をLongおよびShort Termメモリ(LSTM)ネットワークに転送する。次に,最終的な高密度層は鳥類種を分類する。10クラス分類器に対して,達成された最高精度は,13のメル周波数セプストラム係数(MFCC)と12のクロマチンベクトルから成る特徴集合に対して90.45%であった。対応する特異性とAUCスコアは,それぞれ98.94%と94.09%であった。【JST・京大機械翻訳】