文献
J-GLOBAL ID:202102287453926436   整理番号:21A0088441

弱教師付きオーディオ分類のためのマルチレベル注意融合ネットワーク【JST・京大機械翻訳】

A Multi-level Attention Fusion Network for Weakly Supervised Audio Classification
著者 (4件):
資料名:
巻: 677  ページ: 687-695  発行年: 2020年 
JST資料番号: W5070A  ISSN: 1876-1100  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: ドイツ (DEU)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
オーディオ分類は,異なる種類の音を識別することを目的とし,人工知能応用にとって非常に重要である。それにもかかわらず,この分野で直面するいくつかの課題,特に弱ラベル化オーディオ信号の分類がある。オーディオクリップは時間的情報と空間情報を含む。しかしながら,既存の方法は,分類効果が改善する必要があるように,部分情報を利用するだけである。分類精度を改善するために,著者らは,マルチアテンション融合(MAF)モジュールとマルチレベル融合(MLF)モジュールを含む深い監視に基づくマルチレベル注意融合ネットワーク(MLAFNet)を提案した。MAFモジュールは,時間と空間ドメインから情報を完全に利用することができた。深い監視戦略に基づくMLFモジュールは,粗粒と細粒情報を組み合わせることができる。拡張実験をGoogle Audio Setに基づいて行い,いくつかの最先端の手法を超える提案ネットワークの有効性を実証し,それはAUCで0.970,d-プライムで2.652を達成した。Copyright The Author(s), under exclusive license to Springer Nature Singapore Pte Ltd. 2021 Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (5件):
分類
JSTが定めた文献の分類名称とコードです
図形・画像処理一般  ,  パターン認識  ,  人工知能  ,  写真測量,空中写真  ,  音声処理 
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る