特許
J-GLOBAL ID:200903028405519159
音声認識装置および音声認識方法
発明者:
,
出願人/特許権者:
代理人 (3件):
岩橋 文雄
, 坂口 智康
, 内藤 浩樹
公報種別:公開公報
出願番号(国際出願番号):特願2003-106394
公開番号(公開出願番号):特開2004-309959
出願日: 2003年04月10日
公開日(公表日): 2004年11月04日
要約:
【課題】低S/Nの音声に対しても高い認識率を得るために入力信号に対して雑音抑圧手法を用いる音声認識装置において、雑音抑圧係数推定精度によって、抑圧後の音声がより歪んでしまうことがあり、このような場合音声認識に悪影響をあたえてしまう、という課題があった。【解決手段】雑音抑圧手段14により雑音抑圧された音声B6に対して特徴量抽出手段16、尤度算出手段107、最尤探索手段109により音声認識を行い、算出された尤度、特徴量ベクトル、音素列などの認識情報B10より、抑圧量判定係数算出手段21が抑圧量判定係数を算出し、抑圧量推定手段13は抑圧量判定係数をも利用して、雑音抑圧手段14で抑圧する雑音抑圧量を制御する。【選択図】 図1
請求項(抜粋):
入力音声に対して雑音抑圧を行うためのスペクトル変換手段と、前記スペクトル変換手段が出力する信号よりS/Nを推定するS/N推定手段と、雑音抑圧演算に用いられる雑音抑圧係数をテーブルとして保持している雑音抑圧係数保持手段と、前記雑音抑圧係数保持手段が保持しているテーブルや前記S/N推定手段が推定したS/Nより雑音抑圧量を推定し、前記雑音抑圧係数を算出する抑圧量推定手段と、前記スペクトル変換手段が出力する信号から前記抑圧量推定手段が算出した雑音抑圧係数に基づいて雑音抑圧演算を行う雑音抑圧手段と、前記雑音抑圧手段より出力される信号から認識尤度を求めるための特徴量ベクトルを抽出する特徴量抽出手段と、学習データである音響モデルを保存する音響モデル保存手段と、時系列に前記音響モデル保存手段が保持する音響モデルと前記特徴量抽出手段が出力する特徴量ベクトルを比較して尤度を算出する尤度算出手段と、音声認識用の単語辞書または文法等の認識用ルールを保存する文法辞書保存手段と、前記認識用ルールに従って前記尤度より最尤パスを求める最尤探索手段と、前記最尤探索手段の結果を認識結果として表示提示する結果表示提示手段と、前記尤度算出手段および前記最尤探索手段が出力する認識結果より、抑圧量の判定を行う指標となる抑圧量判定係数を求める抑圧量判定係数算出手段とを備え、
前記抑圧量推定手段は、前記抑圧量判定係数算出手段が算出する抑圧量判定係数も利用して雑音抑圧量を推定し、雑音抑圧係数を算出することを特徴とする音声認識装置。
IPC (4件):
G10L15/20
, G10L15/18
, G10L15/22
, G10L21/02
FI (4件):
G10L3/02 301D
, G10L3/00 561C
, G10L3/00 537A
, G10L9/00 F
Fターム (6件):
5D015AA02
, 5D015BB02
, 5D015CC11
, 5D015CC17
, 5D015EE05
, 5D015LL02
前のページに戻る