特許
J-GLOBAL ID:200903010629151762

音声処理装置、音声認識プログラムを記録した記録媒体、処理プログラムを記録した記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 伊藤 進
公報種別:公開公報
出願番号(国際出願番号):特願平10-011632
公開番号(公開出願番号):特開平11-212595
出願日: 1998年01月23日
公開日(公表日): 1999年08月06日
要約:
【要約】【課題】 記録された音声データのレベルによらず安定した音声認識を行うことができるディクテーションシステムを提供する。【解決手段】 音声メモリ11から音声データを読み出して復号化処理12を行い、該音声データ中の有音/無音判定処理13を行って、有音部分についてサンプル絶対値平均値計算処理14を行うことによりレベルを判定し、そのレベルに基づいてゲイン計算処理15を行い、上記復号化処理12された音声データにゲイン乗算処理16を行って音声認識を行うに適したレベルに調整し、レベル調整された音声データに基づいて音声認識処理17を行って表示18をするディクテーションシステム。
請求項(抜粋):
音声データが記録された記録媒体から音声データを読み出す読出手段と、上記読出手段で読み出した音声データのレベルを所定の方法で調整するレベル調整手段と、上記レベル調整手段でレベルを調整した後の音声データを音声認識をする音声認識手段と、上記音声認識手段の認識結果を出力する出力手段と、を具備することを特徴とする音声処理装置。

前のページに戻る