文献
J-GLOBAL ID:201702248805110057   整理番号:17A0662577

多声音楽における主要な楽器認識のための深層畳込みニューラルネットワーク【Powered by NICT】

Deep Convolutional Neural Networks for Predominant Instrument Recognition in Polyphonic Music
著者 (3件):
資料名:
巻: 25  号:ページ: 208-221  発行年: 2017年 
JST資料番号: W0508B  ISSN: 2329-9290  CODEN: ITASFA  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
多声音楽記録における楽器の同定音楽情報検索の分野における挑戦的ではあるが重要な問題である。装置による音楽検索を可能にする,音楽ジャンルを認識する,または音楽転写をより容易かつ正確にすることができる。本論文では,実世界多音音楽における支配的な機器認識のための畳込みニューラルネットワークフレームワークを提案した。単一ラベル支配的な装置を用いた固定長音楽抜粋からネットワークを訓練し,可変長によるオーディオ信号から任意数の支配的な機器を推定した。オーディオ抜粋賢明な結果を得るために,試験オーディオ上のスライディングウィンドウからの複数の出力を凝集する。そうすることで,二つの異なる凝集法:一つはクラス平均続いて正規化を,もう一つは平均化過程の影響散発的に出現する装置の活性化を抑制することを最小化するための平均と正規化段階の前に出力確率に対する時間的に局所的なクラス最大プーリングを行うを検討した。添加では,パラメータの最適セットを見つけるためにニューラルネットワークのための性能,解析ウィンドウサイズ,同定しきい値,活性化関数を含むに影響するいくつかの重要な因子に関する広範な実験を行った。装置的性能に関する著者らの解析は,発症型は,各々の計器の再現率と精度のための重要な因子であることを見出した。評価のための十一の装置から10Kオーディオ抜粋のデータセットを用いて,著者らは,畳込みニューラルネットワークであるサポートベクトルマシンによるスペクトルの特徴と音源分離を利用する従来の方法よりもよりロバストであることを見出した。実験結果は,提案した畳込みネットワークアーキテクチャは,マクロのためのマイクロ0.513 0.619のF1測度を得た,最新のアルゴリズムと比較して性能向上で23.1%と18.8%を達成することを示した。Copyright 2017 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識 
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る