特許
J-GLOBAL ID:200903038420026709

音声認識方法、その装置およびプログラム、その記録媒体

発明者:
出願人/特許権者:
代理人 (2件): 草野 卓 ,  稲垣 稔
公報種別:公開公報
出願番号(国際出願番号):特願2004-179723
公開番号(公開出願番号):特開2006-003617
出願日: 2004年06月17日
公開日(公表日): 2006年01月05日
要約:
【課題】 音声応答装置の音声認識においてガイダンス音(音声)がエコーとして混入しても高い認識率とする。【解決手段】 システム音声生成部32からのガイダンス音を用いてスピーカ31からマイクロホン34に回り込むエコー信号を、マイクロホン34よりの入力信号に対し抑圧処理し、更に背景雑音の抑圧処理を行い、その後、残留エコーを抑圧する。エコー及び雑音抑圧された入力信号の特徴ベクトルを抽出し、特徴ベクトルより、入力信号が音声区間か雑音区間かの判定を行い、雑音区間であれば、その特徴ベクトルについて雑音モデルを学習し、雑音モデルとクリーン音声モデルとを合成して雑音重畳音声モデルとする。入力信号が音声区間と判定された特徴ベクトルに対し、雑音重畳音声モデルの尤度を計算し、尤度が最も高いモデルの認識カテゴリを認識結果として出力する。【選択図】 図3
請求項(抜粋):
マイクロホンにより音響信号を収音し、スピーカより音響信号を放音する装置における上記マイクロホンにより収音した音声信号を確率モデルを用いて音声認識を行う音声認識方法であって、 上記マイクロホンよりの入力信号中の、上記スピーカからの放音信号成分(以下エコー信号という)を、上記スピーカへの供給信号を用いて抑圧し、かつ上記入力信号中の周囲雑音信号を抑圧する雑音・エコー抑圧ステップと、 上記エコー信号および周囲雑音信号が抑圧された信号を特徴ベクトル系列に変換する特徴ベクトル抽出ステップと、 上記特徴ベクトル系列が認識対象の音声信号を含む音声区間のものか、それ以外の雑音区間のものかを判定する区間判定ステップと、 上記区間判定ステップで雑音区間と判定した上記特徴ベクトル系列を用いて雑音モデルを学習する雑音モデル学習ステップと、 上記雑音モデルと、雑音がないクリーンな音声データを用いて予め作成されたクリーン音声モデルとを合成して雑音重畳音声モデルを生成する雑音重畳音声モデル合成ステップと、 上記区間判定ステップで音声区間と判定された上記特徴ベクトル系列と上記雑音重畳音声モデルとを用いて認識カテゴリに対する尤度を計算する尤度計算ステップと、 上記計算された尤度に基づき、認識結果を出力する出力ステップと を有することを特徴とする音声認識方法。
IPC (6件):
G10L 15/06 ,  G10L 15/20 ,  G10L 21/02 ,  G10L 15/14 ,  G10L 11/02 ,  G10L 15/04
FI (4件):
G10L3/00 521T ,  G10L3/02 301D ,  G10L3/00 535A ,  G10L3/00 513Z
Fターム (3件):
5D015DD03 ,  5D015EE05 ,  5D015GG05
引用特許:
出願人引用 (1件)
  • 特許第3247746号公報
審査官引用 (6件)
全件表示
引用文献:
審査官引用 (1件)
  • "Taylor展開による音響モデルの適応"

前のページに戻る