文献
J-GLOBAL ID:202102247632235421   整理番号:21A2598013

深層学習に基づく間引きインジケータ付き周波数帯域補間手法による音源分離処理の高速化

Fast audio source separation based on deep-neural-network-based frequency component interpolation with decimation indicator.
著者 (6件):
資料名:
巻: 2021  号: 秋季  ページ: ROMBUNNO.1-1-14  発行年: 2021年08月24日 
JST資料番号: G0381C  ISSN: 1880-7658  資料種別: 会議録 (C)
記事区分: 短報  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
・本稿では任意の周波数ビンの間引き方(分割手法)に対応可能な音源分離フレームワークを提案。
・本手法では,混合信号のスペクトログラムに対し,パワーが大きい帯域が音源分離に有効な周波数ビンであるとみなして分割。
・この時,DNNは間引かれた周波数ビンの分離信号成分を予測しなければならないため,どこを間引いたかを表すインジケータを新たに設け,DNNの入力情報として使用。
・実験から,従来の分割手法と比較し,音源分離性能が向上したことを確認。
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
音声処理 
引用文献 (10件):
  • H. Sawada, H. Kameoka, S. Araki, and N. Ueda, “Multi-channel extensions of non-negative matrix factorization with complex-valued data,” IEEE Trans. ASLP, vol. 21, no. 5, pp. 971-982, 2013.
  • P.-S. Huang, M. Kim, M. H.-Johnson, and P. Smaragdis, “Joint optimization of masks and deep recurrent neural networks for monaural source separation,” IEEE/ACM Trans. ASLP, vol. 23, no. 12, pp. 2136-2147, 2015.
  • J. R. Hershey, Z. Chen, J. Le Roux, and S. Watanabe, “Deep clustering: discriminative embeddings for segmentation and separation,” Proc. ICASSP, pp. 31-35, 2016.
  • 渡辺瑠伊, 北村大地, “音源分離のための深層学習に基づく音響帯域拡張” 日本音響学会 2020年春季研究発表会講演論文集, pp. 221-224, 2020.
  • 渡辺瑠伊, 北村大地, 猿渡洋, 高橋祐, 近藤多伸, “深層学習に基づく音響帯域拡張による音源分離処理の高速化” 日本音響学会 2020年秋季研究発表会講演論文集, pp. 131-134, 2020.
もっと見る

前のページに戻る