特許
J-GLOBAL ID:201403033974057388

音響信号解析装置、方法、及びプログラム

発明者:
出願人/特許権者:
代理人 (1件): 特許業務法人太陽国際特許事務所
公報種別:公開公報
出願番号(国際出願番号):特願2012-190189
公開番号(公開出願番号):特開2014-048399
出願日: 2012年08月30日
公開日(公表日): 2014年03月17日
要約:
【課題】音源数が不明であっても、複数のマイクロホンから出力された音響信号の時系列データから、音源毎の音源信号に精度よく分離することができるようにする。【解決手段】パラメータ更新部23により、各周波数ωに対する各時刻tにおいてアクティブとなる音源を1個とし、各音源kがアクティブになる確率の事前分布を棒折過程でモデル化し、各音源kの到来方向のインデックスを示すインジケータの事前分布を離散確率分布でモデル化し、各音源kが各インデックスの到来方向となる確率の事前分布をディレクレ分布でモデル化し、音源信号の生成モデルのパラメータの事後分布を近似する変関数のパラメータを変分推論法に基づき繰り返し更新する。時間周波数成分推定部26は、最終的に更新されたパラメータを用いて、各音源kの音源信号の時間周波数成分を推定する。【選択図】図1
請求項(抜粋):
M個(Mは2以上の整数)のマイクロホンmから出力される音響信号の時系列データを入力として、観測時間周波数成分ym,ω,t(mはマイクロホン、tは時刻、ωは周波数のインデックスである。)を要素にもつ三次元配列y^を出力する時間周波数解析手段と、 各周波数ωについて、D個(Dは1以上の整数)の音源kの各々から各マイクロホンmへの音源信号の伝達周波数特性am,k,ωを要素にもつ三次元配列a^に含まれる各ベクトルak,ω^の事後分布のパラメータ(複素正規分布の平均ベクトルmk,ω^、共分散行列Γk,ω)、各周波数ωに対する各時刻tにおいてアクティブな音源の時間周波数成分sω,tを要素にもつ二次元配列s^に含まれる各要素sω,tの事後分布のパラメータ(複素正規分布の平均μω,t、分散σ2ω,t)、各周波数ωに対する各時刻tにおいてアクティブとなる音源のインデックスを示すインジケータzω,tを要素にもつ二次元配列z^の各要素zω,tの事後分布のパラメータ(離散確率分布の各パラメータφk,ω,t)、各音源kがアクティブになる確率vkを要素にもつベクトルv^の各要素vkの事後分布のパラメータ(ベータ分布のパラメータγk,0、γk,1)、各音源kの到来方向のインデックスiを示すインジケータxkを要素にもつベクトルx^の各要素xkの事後分布のパラメータ(離散確率分布の各パラメータψk,i)、各音源kが各インデックスiの到来方向となる確率ρk,iを要素にもつ二次元配列ρ^の各ベクトルρk^の事後分布のパラメータ(ディレクレ分布の各パラメータζk,i)の各々の初期値を設定する初期設定手段と、 前記三次元配列y^が与えられたときの前記三次元配列a^、前記二次元配列s^、前記二次元配列z^、前記ベクトルv^、前記ベクトルx^、及び前記二次元配列ρ^の事後分布p(a^、s^、z^、v^、x^、ρ^|y^)と変関数q(a^、s^、z^、v^、x^、ρ^)との間の差異を表すダイバージェンスを表す関数を目的関数として、変分推論法に基づき前記目的関数を最小化するように、(k、m)の全ての組み合わせの各々における前記平均ベクトルmk,ω^及び前記分散Γk,ωと、(ω、t)の全ての組み合わせの各々における前記平均μω,t及び前記分散σ2ω,tと、(k、ω、t)の全ての組み合わせの各々における前記パラメータφk,ω,tと、全てのkにおける前記パラメータγk,0、γk,1、前記パラメータψk,iと、(k、i)の全ての組み合わせの各々におけるパラメータζk,iとを更新するパラメータ更新手段と、 予め定められた終了条件を満たすまで、前記パラメータ更新手段による更新を繰り返し行う終了判定手段と、 (k、ω、t)の全ての組み合わせの各々について、前記パラメータφk,ω,t及び平均μω,tに基づいて、前記音源kの音源信号の時間周波数成分sk,ω,tを推定する音源信号推定手段と、 を含む音響信号解析装置。
IPC (2件):
G10L 21/028 ,  H04R 3/00
FI (2件):
G10L21/02 201D ,  H04R3/00 320
Fターム (2件):
5D220BA06 ,  5D220BC05
引用特許:
出願人引用 (1件) 審査官引用 (1件)
引用文献:
出願人引用 (2件)
  • 混合DOAモデルに基づく多チャンネル複素NMFによる劣決定BSS
  • ディリクレ事前分布を用いた音声のスパース性に基づく音源数推定と音源分離
審査官引用 (2件)
  • 合DOAモデルに基づく多チャンネル複素NMFによる劣決定BSS
  • ディリクレ事前分布を用いた音声のスパース性に基づく音源数推定と音源分離

前のページに戻る