特許
J-GLOBAL ID:201403078499371467

音響信号解析装置、方法、及びプログラム

発明者:
出願人/特許権者:
代理人 (1件): 特許業務法人太陽国際特許事務所
公報種別:公開公報
出願番号(国際出願番号):特願2012-190188
公開番号(公開出願番号):特開2014-048398
出願日: 2012年08月30日
公開日(公表日): 2014年03月17日
要約:
【課題】複数のマイクロホンから出力された音響信号の時系列データから、音源毎の音源信号に精度よく分離することができるようにする。【解決手段】確率更新部241、時変ゲイン更新部242、及び分離行列更新部243により、各周波数に対する各時間フレームにおいて調波構造を有するパワースペクトルテンプレートの各々が音源毎に選択される確率を要素にもつ三次元配列Π^を用いて、観測時間周波数成分の三次元配列Xが与えられたときの三次元配列Π^、各音源のパワーを要素にもつ二次元配列Σ^、及び各周波数ωの分離行列Wω^の事後確率を表す目的関数を最大化するように、三次元配列Π^、二次元配列Σ^、及び各周波数ωの分離行列Wω^を更新することを繰り返す。【選択図】図1
請求項(抜粋):
M個(Mは2以上の整数)のマイクロホンmから出力される音響信号の時系列データを入力として、観測時間周波数成分Xmτω(mはマイクロホン、τは時間フレーム、ωは周波数のインデックスである。)を要素にもつ三次元配列Xを出力する時間周波数解析手段と、 M個の音源kの時間周波数成分Ykτω(kは音源、τは時間フレーム、ωは周波数のインデックスである。)を要素にもつ三次元配列Y^、各音源kについて各時間フレームτにおいて調波構造を有するパワースペクトルテンプレートλ(l)ω(lは、パワースペクトルテンプレートのインデックスである。)が選択される確率π(l)kτを要素にもつ三次元配列Π^、各時間フレームτにおける各音源kのパワーσ2kγを要素にもつ二次元配列Σ^、及び各周波数ωについて、Xτω(=(X1τω,・・・,XMτω))に作用させて音源信号の時間周波数成分Yτω(=(Y1τω,・・・,YKτω))を得るための分離行列Wω^の各々の初期値を設定するパラメータ初期値設定手段と、 (k、τ、ω、zkτ)の全ての組み合わせにおける、zkτとσ2kγが与えられたときの、λ(zkτ)ω・σ2kγを分散とするガウス分布で表されるYkτωの確率密度関数、及びπkτが与えられたときのzkτの確率、(k、τ、l)の全ての組み合わせに対する前記確率π(l)kτの事前確率、及び各周波数ωに対する前記分離行列Wω^の行列式を用いて表された、前記三次元配列X^が与えられたときの前記三次元配列Π^、前記二次元配列Σ^、及び各周波数ωの前記分離行列Wω^の事後確率を表す目的関数を最大化するように、前記三次元配列Π^、前記二次元配列Σ^、及び各周波数ωの前記分離行列Wω^を更新するパラメータ更新手段と、 各周波数ωの前記分離行列Wω^及び前記三次元配列X^に基づいて、前記三次元配列Y^を更新する音源信号推定値更新手段と、 予め定められた終了条件を満たすまで、前記パラメータ更新手段による更新、及び前記音源信号推定値更新手段による更新を繰り返し行う終了判定手段と、 を含む音響信号解析装置。
IPC (1件):
G10L 21/030
FI (1件):
G10L21/02 203Z
引用特許:
出願人引用 (1件) 審査官引用 (1件)
引用文献:
出願人引用 (2件) 審査官引用 (2件)

前のページに戻る