特許
J-GLOBAL ID:200903085477631950
音声検出方法
発明者:
出願人/特許権者:
代理人 (1件):
柿本 恭成
公報種別:公開公報
出願番号(国際出願番号):特願平6-228535
公開番号(公開出願番号):特開平8-095591
出願日: 1994年09月26日
公開日(公表日): 1996年04月12日
要約:
【要約】【目的】 長期間に亘って正確でかつ安定した音声検出性能を得る。【構成】 入力特徴パタン計算部1は入力音声信号INを分析して音響パラメータXi(t)を算出する。雑音距離パタン計算部2は、音響パラメータXi(t)及び雑音標準パラメータ算出部3に記憶されている雑音標準パラメータNi(t)から雑音距離D(t)を計算する。雑音距離正規化部4は、雑音距離D(t)から推定平均雑音距離NA(t)と推定雑音分散NV(t)を用いて正規化雑音距離ND(t)を計算する。音声距離正規化部5は、雑音距離D(t)から推定平均音声距離VA(t)と推定音声分散VV(t)を用いて正規化音声距離VD (t)を計算する。音声検出判定部6は、正規化雑音距離ND(t)及び正規化音声距離VD(t)から音声判定距離ED(t)を計算する
請求項(抜粋):
予め設定した一定フレーム長毎に入力音声信号の特徴を表す入力音響パラメータの組を求め、該入力音響パラメータを用いて音声区間の検出を行う音声検出方法において、入力音声信号中の雑音区間内の入力音響パラメータから雑音の特徴を表す特性値の組を雑音標準パラメータとして学習する雑音標準パラメータ学習処理と、前記雑音区間内の入力音響パラメータ系列と前記雑音標準パラメータ間の距離の特徴から雑音距離の統計量を計算する雑音距離正規化処理と、入力音声信号中の音声区間と判定された区間での入力音響パラメータ系列と前記雑音標準パラメータ間の距離の特徴から音声距離の統計量を計算する音声距離正規化処理と、前記雑音距離の統計量及び前記音声距離の統計量に基づいて音声検出用判定関数を決定する音声検出用判定関数決定処理と、前記雑音標準パラメータと前記入力音響パラメータとの距離を前記音声検出用判定関数を用いて変換した音声判定距離に基づいて音声区間を検出する音声区間検出処理とを、行うことを特徴とする音声検出方法。
前のページに戻る