特許
J-GLOBAL ID:200903060163421460

音声認識装置及び方法

発明者:
出願人/特許権者:
代理人 (1件): 永田 武三郎
公報種別:公開公報
出願番号(国際出願番号):特願平4-212180
公開番号(公開出願番号):特開平6-035498
出願日: 1992年07月16日
公開日(公表日): 1994年02月10日
要約:
【要約】【目的】 騒音により変形された音声の分析データを波形整形することで、耐騒音性能(音声認識率)を向上させた音声認識装置の提供。【構成】 音声認識装置は、音声分析部100、音声入力部105、音声認識部200、辞書部300、コントローラ301、音声波形整形部402を有する騒音対策部400から構成されている。音声分析部100から出力された騒音成分を含む分析データは音声波形整形部402に入力し、音声波形整形部402は有音検出用波形(区間検出用波形)によりデータのゼロ詰め範囲を検出しながら順次音声認識データの波形整形を行なう。音声波形整形部402は音声分析部100からの出力データを受け取ると音声区間検出手段により対称チャンネルの分析データとCH7の有音検出用波形とを比較し区間ゼロ詰め処理手段によりデフォルトの場合はゼロデータを音声認識部200に出力する。また、音声波形整形処理方式は音声の存在範囲が検出(有意判定)されたときのみ音声分析部100から入力した音声認識データを出力する。
請求項(抜粋):
音声入力部により取り込まれた音声を所定の音声分析データに変換する音声分析部と、該音声分析データを波形整形処理し波形整形処理信号を得る騒音対策部と、該波形整形処理信号に基づいて前記音声を認識処理し音声認識結果を得る音声認識部を備え、前記音声分析部が騒音成分を含んだ音声を複数の所定帯域毎に分割し、第1の音声分析データとしての前記所定帯域毎の音声認識処理用データと第2の音声分析データとしての前記所定帯域の全てを含む帯域の音声区間検出用データを得る音声分析データ抽出手段を有し、前記騒音対策部が、有音検出用波形データに基づいて前記第1の音声分析データの音声区間を検出し、所定の波形整形用パラメータに基づいて音声成分の有無を判定する音声区間検出手段と、音声区間判定結果に基づいて前記第1の音声分析データの音声区間の有無を判定し波形整形区間を設定する波形整形区間設定手段と、波形整形区間設定手段の設定値に基づいて前記第1の音声分析データの音声区間内に含まれる無音区間を略ゼロ詰め処理して波形整形し波形整形処理信号を得る信号波形整形処理手段と、を有する音声波形整形部を含むことを特徴とする音声認識装置。

前のページに戻る