特許
J-GLOBAL ID:200903029208742179
音声認識装置、音声認識方法、該音声認識方法をコンピュータに対して実行させるためのコンピュータ実行可能なプログラムおよび記憶媒体
発明者:
,
出願人/特許権者:
代理人 (4件):
坂口 博
, 市位 嘉宏
, 上野 剛史
, 間山 進也
公報種別:公開公報
出願番号(国際出願番号):特願2003-143224
公開番号(公開出願番号):特開2004-347761
出願日: 2003年05月21日
公開日(公表日): 2004年12月09日
要約:
【課題】周囲環境からの残響がオリジナルの音声に重畳される場合であっても充分に、オリジナル音声を認識するための音声認識装置、音声認識方法、該制御方法をコンピュータに対して実行させるためのコンピュータ実行可能なプログラムおよび記憶媒体を提供する。【解決手段】コンピュータを含んで構成され音声を認識するための音声認識装置であって、該音声認識装置は、音声信号から得られる特徴量をフレームごとに格納する手段20と、音響モデル・データおよび言語モデル・データを格納するための手段24、26と、その時点で処理するべき音声信号よりも前に取得された音声信号から残響音声モデル・データを生成し、残響音声モデル・データを使用して適合音響モデル・データを生成する手段18と、特徴量と適合音響モデル・データと言語モデル・データとを参照して音声信号の音声認識結果を与える手段16とを含む。【選択図】 図5
請求項(抜粋):
コンピュータを含んで構成され音声を認識するための音声認識装置であって、該音声認識装置は、
音声信号から得られる特徴量をフレームごとに格納する記憶領域と、
音響モデル・データおよび言語モデル・データをそれぞれ格納する格納部と、
その時点で処理するべき音声信号よりも前に取得された音声信号から残響音声モデル・データを生成し、残響音声モデル・データを使用して適合音響モデル・データを生成する残響適合モデル生成部と、
前記特徴量と前記適合音響モデル・データと前記言語モデル・データとを参照して音声信号の音声認識結果を与える認識処理手段と
を含む、音声認識装置。
IPC (6件):
G10L15/06
, G10L15/00
, G10L15/10
, G10L15/14
, G10L15/18
, G10L15/28
FI (6件):
G10L3/00 521L
, G10L9/14 301B
, G10L3/00 535C
, G10L9/16 301B
, G10L3/00 551P
, G10L3/00 537A
Fターム (5件):
5D015CC07
, 5D015CC11
, 5D015FF03
, 5D015HH23
, 5D015KK02
前のページに戻る