特許
J-GLOBAL ID:200903005835575141

音声区間検出方法、並びに音声通信装置および音声認識装置

発明者:
出願人/特許権者:
代理人 (1件): 稲本 義雄
公報種別:公開公報
出願番号(国際出願番号):特願平5-297675
公開番号(公開出願番号):特開平7-152397
出願日: 1993年11月29日
公開日(公表日): 1995年06月16日
要約:
【要約】【目的】 実際に発話がなされている有音声区間を正確に検出する。【構成】 まず、使用者の音声を含まない無音声区間における振幅スペクトルの平均値が算出され、これが無音声区間における振幅スペクトルの推定値とされる。そして、この推定値が無音声区間を含む区間における振幅スペクトルから減算され(ステップS17)、さらにその減算結果から、再び無音声区間における振幅スペクトルの推定値が算出され(ステップS20)、この推定値が所定値r以下に収束するまで、ステップS17乃至S21の処理が繰り返される。その後、推定値が所定値r以下に収束すると、振幅スペクトルが所定値r以上の音声信号のフレームが、有音声区間として検出される(ステップS22乃至S25)。
請求項(抜粋):
音声信号から、発話がなされている有音声区間を検出する音声区間検出方法において、前記音声信号から、発話がなされていない無音声区間における振幅スペクトルの推定値を算出し、前記音声信号の振幅スペクトルから、前記推定値を減算することを、前記推定値が所定値以下に収束するまで繰り返し、前記推定値が所定値以下に収束したときに、振幅スペクトルが所定値以上の前記音声信号の区間を、前記有音声区間とすることを特徴とする音声区間検出方法。
IPC (4件):
G10L 7/08 ,  G10L 3/00 513 ,  G10L 3/00 535 ,  G10L 3/00 551

前のページに戻る