抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本研究では,個別に収録/加工された多数の音源から構成されるステレオチャネル楽曲を対象とした,半教師あり音源分離手法を提案する。個別音源から人工的に合成される楽曲は,実環境下で同時収録される楽曲とは異なり,収録時の空間特性を表すチャネル信号間の位相(差)情報を音源分離の手がかりとして利用することが困難である。したがって提案法では,ステレオチャネル楽曲の振幅スペクトログラムに低ランク構造を仮定し,合成楽曲の生成過程を考慮した非負値テンソル因子分解(Non-negative Tensor Factorization:NTF)に基づくモデル化を行う。また,推定される音源が,楽曲内のそれぞれの楽器や歌声のような異なる音色をもつように,提案法では半教師あり音源分離の枠組みを導入し,各音源がそれぞれに固有なスペクトル包絡にしたがうように制約するケプストラム距離正則化(Cepstrum Distance Regularization)を導入する。実験的評価では,実環境で収録された個別音源より合成された楽曲を用いて分離性能を評価し,提案法の有効性を示すとともに,正則化の影響についても調査する。(著者抄録)