特許
J-GLOBAL ID:200903028354137256

音声認識のためのロバストな特徴抽出方法及び装置

発明者:
出願人/特許権者:
代理人 (1件): 大塚 康徳 (外3名)
公報種別:公表公報
出願番号(国際出願番号):特願2001-535161
公開番号(公開出願番号):特表2003-513340
出願日: 2000年09月30日
公開日(公表日): 2003年04月08日
要約:
【要約】本発明は、セグメント化され、スペクトル成分によって特徴づけられる音声信号を、雑音環境下で音声認識するためのロバストな特徴抽出方法及び装置に関する。音声信号はL個(L=1,2,...)のサブバンド内の複数の短時間スペクトル成分に分割され、雑音のみを含むセグメントから雑音スペクトルが推定される。そして、推定された雑音スペクトルが対応する短時間スペクトルからスペクトルサブトラクションされ、各短時間スペクトル成分について、雑音を含む可能性が計算される。最後に、音声を含む可能性の小さな各短時間スペクトルのこれらスペクトル成分が、雑音のみを含む短時間スペクトルを平滑化するために補間される。補間によって、雑音のみを含むスペクトル成分は、近隣で見いだすことの可能な信頼できるスペクトル音声成分によって補間される。
請求項(抜粋):
セグメント化され、スペクトル成分によって特徴づけられる音声信号を、雑音環境下で音声認識するためのロバストな特徴抽出方法であって、 前記音声信号をL個(L=1,2,...)のサブバンド内の複数の短時間スペクトル成分に分割するステップと、 雑音のみを含むセグメントから、雑音スペクトルを推定するステップと、 前記推定された雑音スペクトルを対応する短時間スペクトルからスペクトルサブトラクションするステップと、 各短時間スペクトル成分について、雑音を含む可能性を算出するステップと、 前記短時間スペクトル成分について算出された、音声を含む可能性が低い場合、前記各短時間スペクトルのスペクトル成分を補間するステップとを有することを特徴とする方法。
IPC (4件):
G10L 15/20 ,  G10L 11/00 ,  G10L 15/02 ,  G10L 21/02
FI (3件):
G10L 3/02 301 D ,  G10L 7/04 A ,  G10L 9/16 301 A
Fターム (3件):
5D015CC01 ,  5D015CC11 ,  5D015EE05

前のページに戻る