特許
J-GLOBAL ID:200903024047307297

音声認識電話機

発明者:
出願人/特許権者:
代理人 (1件): 小鍜治 明 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平4-022389
公開番号(公開出願番号):特開平5-219176
出願日: 1992年02月07日
公開日(公表日): 1993年08月27日
要約:
【要約】【目的】 音声認識機能つき電話機において、単語の発声により発信先を指定するときに応答する確認音声は、周囲の環境にかかわらず雑音の無い聞き取りやすい音声として提供する。【構成】 マイクロホン101から単語音声を入力し、特徴抽出部102で音声認識を行い、分析データは登録/認識切換部103により標準パタンメモリ105へ蓄積され、同時に特徴抽出部102から雑音除去部107へ重み付け係数の更新停止信号を出力する。マイクロホン101から入力された音声は、雑音除去部107において記憶している重み付け停止直前の雑音除去パラメータを用いて音声と定常的な雑音の混じった信号から音声信号のみを取り出し、音声符号化部108で雑音のない音声信号をデジタル符号化し、標準パタン録音メモリ109へ出力され音声復号化部109でアナログ化されスピーカ114で聴取する。
請求項(抜粋):
周期的フレームごとに入力音声を分析し、音響特徴を示す特徴パラメータを抽出すると同時に音声の有無を判定する特徴抽出部と、前記特徴抽出器の出力の複数の登録単語の特徴パラメータを記憶する標準パタンメモリと、入力された音声の特徴パラメータと前記標準パタンメモリの中の複数の単語の特徴パラメータを比較し、最も類似したものを判定するパタン比較部と、前記標準パタンメモリの登録単語に対応した複数の発信先ダイヤルを記憶する電話番号メモリと、入力音声と前記標準パタンメモリの最も類似した単語に対応する発信先へ発呼できる回線制御部と、認識結果の確認のために登録時の音声を出力するための入力音声の録音符号化用の入力音声からデジタルデータへ変換する音声符号化部と、複数の登録単語の録音符号化パラメータを記憶する標準パタン録音メモリと、録音符号化パラメータからアナログ波形を出力する音声復号化部と、定常的な雑音中に音声が入力された場合、音声と雑音の混じった信号から雑音を取り除く雑音除去部と、前記各構成要素の動作を認識し音声認識動作を制御する認識制御部とを有し、前記認識制御部は前記音声符号化部への入力の前処理として、前記特徴抽出部の音声の音声有無の判定で、音声なしのとき前記雑音除去部において雑音に適応する動作を行わせ、音声ありのとき前記雑音除去部の適応動作を停止し、停止直前までの適応パラメータを用いて入力音声の雑音を除去する制御を行うよう構成してなる音声認識電話機。
IPC (3件):
H04M 1/27 ,  G10L 3/00 551 ,  G10L 3/02 301

前のページに戻る