音声認識方法、その装置およびプログラム、その記録媒体

Inventor： ,
Applicant, Patent owner：
Agent (2)：草野卓 , 稲垣稔
Gazette classification：公開公報
Application number (International application number)：2004179723
Publication number (International publication number)：2006003617
Application date： Jun. 17, 2004
Publication date： Jan. 05, 2006
Summary：

【課題】音声応答装置の音声認識においてガイダンス音(音声)がエコーとして混入しても高い認識率とする。【解決手段】システム音声生成部32からのガイダンス音を用いてスピーカ31からマイクロホン34に回り込むエコー信号を、マイクロホン34よりの入力信号に対し抑圧処理し、更に背景雑音の抑圧処理を行い、その後、残留エコーを抑圧する。エコー及び雑音抑圧された入力信号の特徴ベクトルを抽出し、特徴ベクトルより、入力信号が音声区間か雑音区間かの判定を行い、雑音区間であれば、その特徴ベクトルについて雑音モデルを学習し、雑音モデルとクリーン音声モデルとを合成して雑音重畳音声モデルとする。入力信号が音声区間と判定された特徴ベクトルに対し、雑音重畳音声モデルの尤度を計算し、尤度が最も高いモデルの認識カテゴリを認識結果として出力する。【選択図】図3

Claim (excerpt)：

マイクロホンにより音響信号を収音し、スピーカより音響信号を放音する装置における上記マイクロホンにより収音した音声信号を確率モデルを用いて音声認識を行う音声認識方法であって、上記マイクロホンよりの入力信号中の、上記スピーカからの放音信号成分(以下エコー信号という)を、上記スピーカへの供給信号を用いて抑圧し、かつ上記入力信号中の周囲雑音信号を抑圧する雑音・エコー抑圧ステップと、上記エコー信号および周囲雑音信号が抑圧された信号を特徴ベクトル系列に変換する特徴ベクトル抽出ステップと、上記特徴ベクトル系列が認識対象の音声信号を含む音声区間のものか、それ以外の雑音区間のものかを判定する区間判定ステップと、上記区間判定ステップで雑音区間と判定した上記特徴ベクトル系列を用いて雑音モデルを学習する雑音モデル学習ステップと、上記雑音モデルと、雑音がないクリーンな音声データを用いて予め作成されたクリーン音声モデルとを合成して雑音重畳音声モデルを生成する雑音重畳音声モデル合成ステップと、上記区間判定ステップで音声区間と判定された上記特徴ベクトル系列と上記雑音重畳音声モデルとを用いて認識カテゴリに対する尤度を計算する尤度計算ステップと、上記計算された尤度に基づき、認識結果を出力する出力ステップとを有することを特徴とする音声認識方法。

IPC (6)：

G10L 15/06 , G10L 15/20 , G10L 21/02 , G10L 15/14 , G10L 11/02 , G10L 15/04

FI (4)：

G10L3/00 521T , G10L3/02 301D , G10L3/00 535A , G10L3/00 513Z

F-Term (3)：

5D015DD03 , 5D015EE05 , 5D015GG05

Patent cited by the Patent：

Cited by applicant (7)

特許第3247746号公報
モデル適応方法、装置およびその記憶媒体
Gazette classification：公開公報 Application number：特願平9-251068 Applicant：日本電信電話株式会社
ノイズ/オーディオ音キャンセル装置
Gazette classification：公開公報 Application number：特願平11-192681 Applicant：アルパイン株式会社

Show all

Cited by examiner (6)

モデル適応方法、装置およびその記憶媒体
Gazette classification：公開公報 Application number：特願平9-251068 Applicant：日本電信電話株式会社
ノイズ/オーディオ音キャンセル装置
Gazette classification：公開公報 Application number：特願平11-192681 Applicant：アルパイン株式会社
音声認識方法
Gazette classification：公開公報 Application number：特願平8-089907 Applicant：日本電信電話株式会社

Show all

Article cited by the Patent：

Cited by applicant (1)

"Taylor展開による音響モデルの適応"

Cited by examiner (1)

"Taylor展開による音響モデルの適応"

Return to Previous Page