特許
J-GLOBAL ID:201803015873285624

音源分離装置、音源分離方法及び音源分離プログラム

発明者:
出願人/特許権者:
代理人 (1件): 特許業務法人酒井国際特許事務所
公報種別:公開公報
出願番号(国際出願番号):特願2016-173580
公開番号(公開出願番号):特開2018-040880
出願日: 2016年09月06日
公開日(公表日): 2018年03月15日
要約:
【課題】音源分離を正確に行うことができる。【解決手段】音源分離装置1は、N個の目的音源の音響信号が混在する際に収録されたM個の観測信号の観測ベクトルを構成する時間周波数分析部11、観測ベクトルを受け取り、各周波数における観測ベクトルの確率分布を、N個の音源に対応するN個の要素分布からなるとともに分布パラメータのうち各音源のパワーに相当するパラメータが周波数方向に構造を持った基底ベクトルとその時変であるアクティベーションとの積和によってモデル化された混合分布でモデル化し、混合分布が、観測ベクトルの分布に近くなるように混合分布のパラメータを推定したのちに各要素分布の事後確率を各音響信号のマスクの推定値とするパラメータ推定部12、及び、観測ベクトル、マスク、基底ベクトル、アクティベーション及び空間相関行列を用いて分離音を計算する音源分離部13を有する。【選択図】図1
請求項(抜粋):
N(N>1)個の目的音源に対応する音響信号が混在する状況において、異なる位置で収録されたM(M>1)個の観測信号を受け取り、各観測信号に短時間信号分析を適用して時間周波数点ごとの観測音響信号を抽出した後に時間周波数点ごとに全ての観測音響信号をまとめたM次元縦ベクトルである観測ベクトルを構成する時間周波数分析部と、 前記時間周波数分析部から観測ベクトルを受け取り、各周波数における観測ベクトルの確率分布を、N個の音源に対応するN個の要素分布からなるとともに分布パラメータのうち各音源のパワーに相当するパラメータが周波数方向に構造を持った基底ベクトルとその時変であるアクティベーションとの積和によってモデル化された混合分布でモデル化し、モデル化した前記混合分布が、前記時間周波数分析部から受け取った観測ベクトルの分布に近くなるように混合分布のパラメータを推定したのちに各要素分布の事後確率を各音響信号に対応するマスクの推定値とするパラメータ推定部と、 前記観測ベクトルと、前記マスクと、前記基底ベクトル、前記アクティベーション及び空間相関行列である分布パラメータ、或いは、その一部を受け取り、分離音を計算する音源分離部と、 を有することを特徴とする音源分離装置。
IPC (3件):
G10L 21/030 ,  G10L 21/027 ,  G10L 21/028
FI (3件):
G10L21/0308 A ,  G10L21/0272 100Z ,  G10L21/028 B
引用特許:
審査官引用 (3件)
引用文献:
審査官引用 (1件)
  • NONNEGATIVE MATRIX FACTORIZATION AND SPATIAL COVARIANCE MODEL FOR UNDER-DETERMINED REVERBERANT AUDIO

前のページに戻る