文献
J-GLOBAL ID:202002211462761750   整理番号:20A1961870

生オーディオからのエンドツーエンドオーディオシーン分類:効率的な表現学習のための多時間周波数分解能CNNアーキテクチャ【JST・京大機械翻訳】

End-to-end audio-scene classification from raw audio: Multi time-frequency resolution CNN architecture for efficient representation learning
著者 (4件):
資料名:
巻: 2020  号: SPCOM  ページ: 1-5  発行年: 2020年 
JST資料番号: W2441A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
生の音声信号からエンドツーエンドの‘聴-シーン分類(ASC)のための新しい多時間CNNアーキテクチャを提案し,研究した。従来のCNNは,フィルタバンクの適用に対応する固定サイズカーネル(画像または1d信号分類)を使用し,各フィルタは一定の時間周波数分解能(即ち,固定持続時間インパルス応答および固定帯域幅周波数応答)を持ち,特に特定の時間周波数トレードオフを有する。対照的に,多重時間周波数分解能を許す方法において,複数のカーネル分岐(最大12分岐)を持つ多時間CNNアーキテクチャを用いて,入力生音声信号を処理するための異なる時間周波数分解能を持つ多重フィルタバンクを可能にし,異なる時間周波数トレードオフに対応する特徴マップ(例えば,非常に狭いバンドから非常に広いバンドスペクトログラフィーマップまでの範囲)を,異なる時間周波数トレードオフに対応するように,用いた。”その方法”を,異なる時間周波数分解能で処理することを可能にした。”その方法”を,異なる時間周波数分解能で,異なる時間周波数分解能を持つ多重フィルタバンクを,異なる時間周波数分解能で処理することを可能にした。”そのために,異なる時間周波数分解能で,複数フィルタバンクを,異なる時間周波数分解能で処理することを可能にした,という点で,異なる時間周波数分解能で,複数のフィルタバンクを,異なる時間周波数分解能で処理するために,異なる時間周波数分解能で,複数のフィルタバンクを許す。このアーキテクチャをエンドツーエンドのオーディオ-シーン分類に適用することは,従来の単一時間CNNよりも,一貫性のある重要な性能強化(例えば12分岐の多時間の場合の11~15%絶対精度)を提供し,また,このタスクに対する最先端の結果を上回ることを示した。Copyright 2020 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
図形・画像処理一般 

前のページに戻る