文献
J-GLOBAL ID:201902247044137708   整理番号:19A2187350

音環境理解の近年の動向:音響イベント分析及び音響シーン分析-統計的手法による音響イベント検出

著者 (2件):
資料名:
巻: 75  号:ページ: 532-537  発行年: 2019年09月01日 
JST資料番号: G0162A  ISSN: 0369-4232  CODEN: NIOGAH  資料種別: 逐次刊行物 (A)
記事区分: 解説  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
・近年盛んに研究されている統計的手法による音響イベント検出に着目し,代表的な手法を概説。
・各手法の利点・欠点を述べるとともに,互いの利点を相補的に活用する枠組みとして,ハイブリッド手法についても紹介。
・音響イベント検出の課題を挙げ,それに対する研究動向について記述。
・代表的な音響イベント検出手法として,確率的生成モデルに基づく手法(GMM-HMM),事例に基づく手法(NMF),識別モデルに基づく手法(ニューラルネットワーク)を紹介。
・ハイブリッド手法に基づく多重音響イベント検出を紹介。
・音響イベント検出の課題と研究動向として,課題(データベース構築),研究動向(弱教師ラベル学習)を紹介。
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
音響信号処理  ,  音声処理 
引用文献 (48件):
  • [1] T. Zhang and C.-C. J. Kuo, “Audio content analysis for online audiovisual data segmentation and classification,” IEEE Trans. Speech Audio Process., 9, 441-457 (2001).
  • [2] M. Xu, C. Xu, L. Duan, J. S. Jin and S. Luo, “Audio keywords generation for sports video analysis,” ACM Trans. Multimedia Comput. Commun. Appl., 4, 11 (2008).
  • [3] Q. Jin, P. Schulam, S. Rawat, S. Burger, D. Ding and F. Metze, “Event-based video retrieval using audio,” Proc. Interspeech 2012, pp.2085-2088 (2012).
  • [4] Y.-T. Peng, C.-Y. Lin, M.-T. Sun and K.-C. Tsai, “Healthcare audio event classification using hidden Markov models and hierarchical hidden Markov models,” Proc. IEEE ICME, pp.1218-1221 (2009).
  • [5] J. A. Stork, L. Spinello, J. Silva and K. O. Arras, “Audio-based human activity recognition using non-Markovian ensemble voting,” Proc. IEEE RO-MAN, pp.509-514 (2012).
もっと見る

前のページに戻る