Pat
J-GLOBAL ID:200903005835575141

音声区間検出方法、並びに音声通信装置および音声認識装置

Inventor:
Applicant, Patent owner:
Agent (1): 稲本 義雄
Gazette classification:公開公報
Application number (International application number):1993297675
Publication number (International publication number):1995152397
Application date: Nov. 29, 1993
Publication date: Jun. 16, 1995
Summary:
【要約】【目的】 実際に発話がなされている有音声区間を正確に検出する。【構成】 まず、使用者の音声を含まない無音声区間における振幅スペクトルの平均値が算出され、これが無音声区間における振幅スペクトルの推定値とされる。そして、この推定値が無音声区間を含む区間における振幅スペクトルから減算され(ステップS17)、さらにその減算結果から、再び無音声区間における振幅スペクトルの推定値が算出され(ステップS20)、この推定値が所定値r以下に収束するまで、ステップS17乃至S21の処理が繰り返される。その後、推定値が所定値r以下に収束すると、振幅スペクトルが所定値r以上の音声信号のフレームが、有音声区間として検出される(ステップS22乃至S25)。
Claim (excerpt):
音声信号から、発話がなされている有音声区間を検出する音声区間検出方法において、前記音声信号から、発話がなされていない無音声区間における振幅スペクトルの推定値を算出し、前記音声信号の振幅スペクトルから、前記推定値を減算することを、前記推定値が所定値以下に収束するまで繰り返し、前記推定値が所定値以下に収束したときに、振幅スペクトルが所定値以上の前記音声信号の区間を、前記有音声区間とすることを特徴とする音声区間検出方法。
IPC (4):
G10L 7/08 ,  G10L 3/00 513 ,  G10L 3/00 535 ,  G10L 3/00 551

Return to Previous Page