特許
J-GLOBAL ID:200903052627490467

音声認識方法、その装置およびプログラム、その記録媒体

発明者:
出願人/特許権者:
代理人 (2件): 草野 卓 ,  稲垣 稔
公報種別:公開公報
出願番号(国際出願番号):特願2004-145345
公開番号(公開出願番号):特開2005-326673
出願日: 2004年05月14日
公開日(公表日): 2005年11月24日
要約:
【課題】 各種S/N条件の入力音声信号に対して認識率を向上させる。【解決手段】 入力音声信号の雑音区間から雑音成分を求め(23)、その雑音成分で雑音区間信号を抑圧し(32)、その残り雑音と、音声区間信号に対して雑音抑圧した信号(34の出力)とからS/Nを推定する(33)。雑音抑圧された音声信号の特徴パワースペクトルを抽出し(13)、メモリ36内の複数S/N条件の学習信号から作成したモデルV1,...,VMを用いて、認識処理を並列に行う(35)。メモリ36内の各モデルと対応したS/N1,...,S/NM中の推定S/Nと最も近いものを求め(37)これと対応したモデルによる認識結果を最終結果として出力する(38)。【選択図】 図4
請求項(抜粋):
入力音声信号から計算した特徴パラメータ系列に対して、各認識結果候補の特徴を表現した確率モデルを用いて計算した類似の尤度から認識結果を出力する音声認識方法において、 前記入力音声信号中の音声区間の信号と雑音区間の信号とを判別する区間判別過程と、 前記音声区間の信号と前記雑音区間の信号から前記入力音声信号の信号対雑音比(以下S/Nと書く)を推定するS/N推定過程と、 前記入力音声信号に対し、複数のS/N条件で作成された雑音重畳音声モデルを用いて認識処理を行う並列認識処理過程と、 前記複数のS/N条件中の前記推定されたS/Nと最も近いものを近接S/N条件として決定する近接S/N決定過程と、 前記近接S/N条件と対応するモデルを用いた認識処理された結果を出力する選択過程と を含むことを特徴とする音声認識方法。
IPC (3件):
G10L15/06 ,  G10L11/02 ,  G10L15/04
FI (3件):
G10L3/00 521T ,  G10L3/00 521V ,  G10L3/00 513Z
Fターム (2件):
5D015GG00 ,  5D015GG01

前のページに戻る