特許
J-GLOBAL ID:200903029875363500

音声認識装置及びマイクロホン周波数特性変換方法

発明者:
出願人/特許権者:
代理人 (1件): 鈴江 武彦 (外6名)
公報種別:公開公報
出願番号(国際出願番号):特願平8-259967
公開番号(公開出願番号):特開平10-105191
出願日: 1996年09月30日
公開日(公表日): 1998年04月24日
要約:
【要約】【課題】入力用マイクロホンと辞書作成用マイクロホンとの周波数特性の差をユーザに負担をかけずに正確に補正できるようにする。【解決手段】基準マイク#aと入力用マイク#bの両方を用いてユーザ発声の音声を音声入力部11により同時に入力することで各マイク毎に音声データを収集し、両音声データを音声分析部12にて周波数分析し、両分析結果の差分と格納部14内の基準マイク#aの周波数特性とから入力用マイク#bの周波数特性を周波数特性演算部13にて求め、格納部15に格納する。認識時には、入力用マイク#bからの入力音声に対して、格納部17内の辞書作成用マイクロホンの周波数特性と格納部15内の入力用マイク#bの周波数特性との差分を用いて周波数特性補正部16にて周波数パラメータの補正を行なうことで、辞書作成用マイクロホンの周波数特性に変換し、認識処理部18での認識処理に供する。
請求項(抜粋):
周波数特性が既知の基準マイクロホンと周波数特性が未知の入力用マイクロホンを用いて、ユーザが発声する音声を前記基準マイクロホンと前記入力用マイクロホンとで同期がとれるように入力する入力手段と、前記入力手段により前記基準マイクロホン及び前記入力用マイクロホンから入力された音声を周波数分析する分析手段と、前記分析手段による前記基準マイクロホン及び前記入力用マイクロホンからの入力音声の周波数分析結果の周波数成分の差分のデータを求め、その差分のデータと前記基準マイクロホンの周波数特性とから、前記入力用マイクロホンの周波数特性を求める周波数特性演算手段と、前記入力用マイクロホンから入力された認識対象音声に対して、予め取得されている辞書作成用マイクロホンの周波数特性と前記周波数特性演算手段により求められた入力用マイクロホンの周波数特性との周波数成分の差分のデータを用いて周波数パラメータの補正を行ない、前記辞書作成用マイクロホンの周波数特性に変換する周波数特性補正手段と、前記周波数特性補正手段により変換された周波数パラメータからなる認識用音声データを認識辞書と照合することにより認識処理し、認識結果を出力する認識処理手段とを具備することを特徴とする音声認識装置。
IPC (4件):
G10L 3/02 301 ,  G10L 3/02 ,  G10L 3/00 511 ,  G10L 9/00
FI (4件):
G10L 3/02 301 A ,  G10L 3/02 301 E ,  G10L 3/00 511 ,  G10L 9/00 F
引用特許:
審査官引用 (15件)
  • 音声歪補正装置
    公報種別:公開公報   出願番号:特願平4-180797   出願人:三菱電機株式会社
  • 特開昭58-198097
  • 特開昭58-198097
全件表示

前のページに戻る