特許
J-GLOBAL ID:201403040217545061

有音区間分類装置、有音区間分類方法、及び有音区間分類プログラム

発明者:
出願人/特許権者:
代理人 (2件): 机 昌彦 ,  下坂 直樹
公報種別:再公表公報
出願番号(国際出願番号):JP2012051553
公開番号(公開出願番号):WO2012-105385
出願日: 2012年01月25日
公開日(公表日): 2012年08月09日
要約:
音源からの音量が変動する場合や、音源数が未知の場合、異なる種類のマイクを混在して使用するような場合にも、観測信号の有音区間をその音源ごとへ適切に分類する。 有音区間分類装置100が、複数のマイクで集音した音声信号のパワースペクトル時系列から、マイクの数の次元を持つパワースペクトルのベクトル系列である多次元ベクトル系列を算出するベクトル算出手段101と、任意の時間長に区切った多次元ベクトル系列の各時刻について、当該時刻とその直前の時刻との差分ベクトルを算出する差分算出手段104と、非直交を許容し、かつ空間次元を超えることを許容した状態で求めた差分ベクトルの主成分を、音源方向として推定する音源方向推定手段105と、各時刻ごとに入力された音声信号の有音区間らしさを示す所定の有音性指標を用いて、音源方向推定手段で求めた音源方向ごとに、当該音源方向が有音区間であるか無音区間であるかを判別する有音区間判定手段106とを備える。
請求項(抜粋):
複数のマイクで集音した音声信号のパワースペクトル時系列から、前記マイクの数の次元を持つパワースペクトルのベクトル系列である多次元ベクトル系列を算出するベクトル算出手段と、 任意の時間長に区切った前記多次元ベクトル系列の各時刻について、当該時刻とその直前の時刻との差分ベクトルを算出する差分算出手段と、 非直交を許容し、かつ空間次元を超えることを許容した状態で求めた前記差分ベクトルの主成分を、音源方向として推定する音源方向推定手段と、 各時刻ごとに入力された前記音声信号の有音区間らしさを示す所定の有音性指標を用いて、前記音源方向推定手段で求めた音源方向ごとに、当該音源方向が有音区間であるか無音区間であるかを判別する有音区間判定手段と を備えることを特徴とする有音区間分類装置。
IPC (3件):
G10L 25/78 ,  H04R 3/00 ,  G10L 25/51
FI (3件):
G10L11/02 ,  H04R3/00 320 ,  G10L11/00 402Z
Fターム (2件):
5D220BA01 ,  5D220BC05

前のページに戻る