特許
J-GLOBAL ID:201303044168022412

音源分離装置、音源分離方法、およびプログラム

発明者:
出願人/特許権者:
代理人 (3件): 中尾 直樹 ,  中村 幸雄 ,  義村 宗洋
公報種別:公開公報
出願番号(国際出願番号):特願2012-052852
公開番号(公開出願番号):特開2013-186383
出願日: 2012年03月09日
公開日(公表日): 2013年09月19日
要約:
【課題】空間的エイリアジングの問題が生じる場合にも、高い性能で音源分離を行う。【解決手段】2個のマイクロホンで観測された観測信号の複素スペクトルを得、観測信号の複素スペクトルのマイクロホン間位相差を各時間周波数について計算する。1個のマイクロホンで観測された観測信号から得られた観測信号の複素スペクトル、特徴量作成部で得られたマイクロホン間位相差、および音源信号の複素スペクトルの分布を表す事前情報を用い、各時間周波数での各音源に対応する観測信号の複素スペクトルおよびマイクロホン間位相差の分布を表す確率モデルのパラメタを推定する。推定されたパラメタから得られる各時間周波数での各音源の観測信号の複素スペクトルおよびマイクロホン間位相差に対する寄与率を用い、各時間周波数での当該寄与率および観測信号の複素スペクトルから、分離信号の複素スペクトルを抽出し、それを時間領域の分離信号に変換する。【選択図】図4
請求項(抜粋):
複数の音源が発した音源信号が混合され、2個のマイクロホンで観測される状況で、上記音源信号それぞれの推定信号である分離信号を分離抽出する音源分離装置であって、 2個のマイクロホンで観測された観測信号を、所定の時間区間ごとに周波数領域表現し、観測信号の複素スペクトルを得る周波数領域変換部と、 上記観測信号の複素スペクトルのマイクロホン間位相差を各時間周波数について計算する特徴量作成部と、 任意の1個のマイクロホンで観測された観測信号から得られた上記観測信号の複素スペクトル、上記特徴量作成部で得られた上記マイクロホン間位相差、および上記音源信号の複素スペクトルの分布を表す事前情報を用い、上記各音源に対応する観測信号の複素スペクトルおよびマイクロホン間位相差の分布を表す確率モデルのパラメタを推定するパラメタ推定部と、 上記パラメタから得られる各時間周波数での上記各音源の上記観測信号の複素スペクトルに対する寄与率を用い、各時間周波数での当該寄与率および上記観測信号の複素スペクトルから、分離信号の複素スペクトルを抽出する音源分離部と、 上記分離信号の複素スペクトルを時間領域の分離信号に変換する時間領域変換部と、 を有する音源分離装置。
IPC (3件):
G10L 21/028 ,  G10L 21/030 ,  H04R 3/00
FI (3件):
G10L21/02 201D ,  G10L21/02 203Z ,  H04R3/00 320
Fターム (1件):
5D020BB04
引用特許:
出願人引用 (3件)
引用文献:
出願人引用 (3件)
  • マイク間位相差とスペクトル包絡の同時クラスタリングに基づくスパース音源分離
  • ディリクレ事前分布を用いた音声のスパース性に基づく音源数推定と音源分離
  • Stereo Source Separation and Source Counting with MAP Estimation with Dirichlet Prior Considering Sp
審査官引用 (3件)
  • マイク間位相差とスペクトル包絡の同時クラスタリングに基づくスパース音源分離
  • ディリクレ事前分布を用いた音声のスパース性に基づく音源数推定と音源分離
  • Stereo Source Separation and Source Counting with MAP Estimation with Dirichlet Prior Considering Sp

前のページに戻る