特許
J-GLOBAL ID:200903074293500044

音声信号区間推定装置、方法、プログラムおよびこれを記録した記録媒体

発明者:
出願人/特許権者:
代理人 (3件): 中尾 直樹 ,  草野 卓 ,  中村 幸雄
公報種別:公開公報
出願番号(国際出願番号):特願2007-229884
公開番号(公開出願番号):特開2009-063700
出願日: 2007年09月05日
公開日(公表日): 2009年03月26日
要約:
【課題】種々の雑音に対して頑健な音声信号区間推定を行う。【解決手段】入力信号13の音響特徴量からその音声状態確率・非音声状態確率を求める第1音響信号分析部14と、入力信号13の基本周波数に含まれる周期性成分および非周期性成分からその音声状態確率・非音声状態確率を求める第2音響信号分析部15と、これらを用いてこれらに適用する重みを求める重み算出部16と、この重みを用いて両音声状態確率を合成した音声状態合成確率と両非音声状態確率を合成した非音声状態合成確率と、音声状態と非音声状態との間の状態遷移モデルとに基づき、音声状態に属する確率(音声状態尤度)と非音声状態に属する確率(非音声状態尤度)を求める音声状態確率/非音声状態確率算出部17と、音声状態尤度と非音声状態尤度から、音声信号区間であるか否かを判定する音声信号区間推定部18とを備える。【選択図】図1
請求項(抜粋):
音響信号において音声信号が存在する区間(以下、音声信号区間という。)を推定する音声信号区間推定装置であって、 上記音響信号をフレーム単位に分割し、フレームの音響特徴量から、前記フレームの音声状態確率および非音声状態確率を求める第1音響信号分析手段と、 上記音響信号をフレーム単位に分割し、フレームの基本周波数に含まれる周期性成分および非周期性成分から、前記フレームの音声状態確率および非音声状態確率を求める第2音響信号分析手段と、 上記第1音響信号分析手段によって得られた上記フレームの音声状態確率/非音声状態確率と、上記第2音響信号分析手段によって得られた上記フレームの音声状態確率/非音声状態確率とを用いて、それぞれに対して重み付けする重みを求める重み算出手段と、 上記第1音響信号分析手段によって得られた上記フレームの音声状態確率と、上記第2音響信号分析手段によって得られた上記フレームの音声状態確率とを、上記重み算出手段によって得られた重みによって重み付けして合成した音声状態合成確率と、上記第1音響信号分析手段によって得られた上記フレームの非音声状態確率と、上記第2音響信号分析手段によって得られた上記フレームの非音声状態確率とを、上記重み算出手段によって得られた重みによって重み付けして合成した非音声状態合成確率とを求め、上記音声状態合成確率と、上記非音声状態合成確率と、音声状態と非音声状態との間の状態遷移モデルとに基づき、上記フレームが音声状態に属する確率(以下、音声状態尤度という。)と上記フレームが非音声状態に属する確率(以下、非音声状態尤度という。)を求める音声状態確率/非音声状態確率算出手段と、 上記音声状態確率/非音声状態確率算出手段によって得られた上記音声状態尤度と上記非音声状態尤度から、上記フレームが音声信号区間であるか否かを判定する音声信号区間推定手段と を備えた音声信号区間推定装置。
IPC (3件):
G10L 15/04 ,  G10L 15/14 ,  G10L 11/02
FI (3件):
G10L15/04 300C ,  G10L15/14 200A ,  G10L11/02
Fターム (1件):
5D015DD04
引用特許:
出願人引用 (1件)
  • 雑音抑制装置
    公報種別:公開公報   出願番号:特願平7-194580   出願人:松下電器産業株式会社
審査官引用 (1件)
  • 雑音抑制装置
    公報種別:公開公報   出願番号:特願平7-194580   出願人:松下電器産業株式会社
引用文献:
前のページに戻る