ケプストラム距離正則化を用いた半教師ありステレオチャネル楽曲音源分離

関翔悟; 戸田智基; 武田一哉

文献

J-GLOBAL ID：201702266375238484 整理番号：17A0789745

ケプストラム距離正則化を用いた半教師ありステレオチャネル楽曲音源分離

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=17A0789745&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=17A0789745&from=J-GLOBAL&jstjournalNo=U0451A") }}

著者 (3件)： , ,
資料名：
巻： 2017 号： MUS-115 ページ： Vol.2017-MUS-115,No.18,1-6 (WEB ONLY) 発行年： 2017年06月10日
JST資料番号： U0451A 資料種別：会議録 (C)
記事区分：短報発行国：日本 (JPN) 言語：日本語 (JA)

本研究では,個別に収録/加工された多数の音源から構成されるステレオチャネル楽曲を対象とした,半教師あり音源分離手法を提案する。個別音源から人工的に合成される楽曲は,実環境下で同時収録される楽曲とは異なり,収録時の空間特性を表すチャネル信号間の位相(差)情報を音源分離の手がかりとして利用することが困難である。したがって提案法では,ステレオチャネル楽曲の振幅スペクトログラムに低ランク構造を仮定し,合成楽曲の生成過程を考慮した非負値テンソル因子分解(Non-negative Tensor Factorization:NTF)に基づくモデル化を行う。また,推定される音源が,楽曲内のそれぞれの楽器や歌声のような異なる音色をもつように,提案法では半教師あり音源分離の枠組みを導入し,各音源がそれぞれに固有なスペクトル包絡にしたがうように制約するケプストラム距離正則化(Cepstrum Distance Regularization)を導入する。実験的評価では,実環境で収録された個別音源より合成された楽曲を用いて分離性能を評価し,提案法の有効性を示すとともに,正則化の影響についても調査する。(著者抄録)

, , , , , , ,

楽器音響 , 音声処理

引用文献 (22件)：

Paris Smaragdis and Judith C Brown, “Non-negative matrix factorization for polyphonic music transcription,” in Proc. of WASPAA, pp. 177-180, 2003.
Shankar Vembu and Stephan Baumann, “Separation of vocals from polyphonic audio recordings,”in Proc. of ISMIR, pp. 337-344, 2005.
Yukara Ikemiya, Kazuyoshi Yoshii, and Katsutoshi Itoyama, “Singing voice analysis and editing based on mutually dependent f0 estimation and source separation,”in Proc. of ICASSP, pp. 574-578, 2015.
Naik, Ganesh R., and Wenwu Wang, Blind source separation, Springer, 2014.
Aapo Hyv?rinen, Juha Karhunen, and Erkki Oja, Independent component analysis, John Wiley & Sons, 2004.

, , , , , ,

前のページに戻る