特許
J-GLOBAL ID:200903024033622670

音声認識方法

発明者:
出願人/特許権者:
代理人 (1件): 草野 卓
公報種別:公開公報
出願番号(国際出願番号):特願平5-305373
公開番号(公開出願番号):特開平7-160285
出願日: 1993年12月06日
公開日(公表日): 1995年06月23日
要約:
【要約】【目的】 実環境音声信号に近い模擬音声信号を作る。【構成】 発声環境31の室内雑音37を表すホスノイズを高品質音声信号に対し付加し、その雑音付加された信号に送話器34と電話回線35との綜合周波数特性の代表的なものと、300Hz〜3.4kHz の帯域制限を与え、その後、回線雑音39を模擬するホワイトノイズを付与して模擬音声信号を得、これを用いてHMM法により音声モデルを学習し、そのモデルを用いて未知の電話音声の認識を行う。
請求項(抜粋):
あらかじめ蓄積された音声信号データを用いて認識対象とする音声信号のモデルを学習して求め、前記学習によって求められた音声信号のモデルに対する類似度を比較することによって未知の音声信号を認識する方法において、被認識音声の発声から認識装置へ達するまでのシステムにおける音声信号の品質を劣化させる各々の要因を抽出してその各要因の特性のひな形となるテンプレートを作成し、前記システムにおける前記各要因の発生所在に応じてその要因の前記テンプレートを高品質音声信号データに順次作用させて、前記各要因間の前記システムにおける相互の影響状況を模擬した模擬音声信号データを作成し、得られた前記模擬音声信号データにより前記モデルを学習し、前記学習によって得られたすべてのモデルを用いて未知の音声信号を認識することを特徴とする音声認識方法。
IPC (4件):
G10L 3/00 521 ,  G10L 3/00 ,  G10L 3/00 535 ,  H04M 3/42

前のページに戻る