特許
J-GLOBAL ID:200903001776403930

音声処理装置及び音声認識装置

発明者:
出願人/特許権者:
代理人 (4件): 牛木 護 ,  吉田 正義 ,  松浦 康次 ,  清水 栄松
公報種別:公開公報
出願番号(国際出願番号):特願2007-051837
公開番号(公開出願番号):特開2008-216488
出願日: 2007年03月01日
公開日(公表日): 2008年09月18日
要約:
【課題】従来に比して音声認識精度が一段と向上し得る音声処理装置及び音声認識装置を提供することを目的とする。【解決手段】音声認識装置1では、瞬時位相特徴量たる0次予測残差Φb(n)と、包絡線特徴量たる対数包絡線mb(n)とを音声信号から算出し、これら瞬時位相特徴量及び包絡線特徴量を、学習済みのサブバンドニューラルネットワーク32a〜32n及び統合ニューラルネットワーク31を用いて識別的に分析し、その分析結果を特徴変換部52により別空間に写像することで音声特徴量を得るようにした。このようにして生成した音声特徴量を用いれば、従来に比して音声認識精度が一段と向上し得る。【選択図】図1
請求項(抜粋):
FIRフィルタ(Finite Impulse Response Filter)により所定数の周波数帯域に音声信号を分割することにより得た各分割帯域信号から、瞬時位相特徴量を抽出する瞬時位相特徴抽出部と、 各前記分割帯域信号から包絡線特徴量を抽出する包絡線特徴抽出部と、 各前記瞬時位相特徴量及び各前記包絡線特徴量を所定時間ずつ切り出して多層パーセプトロン型ニューラルネットワークによって解析することにより音声特徴量を生成する識別分析部と を備えることを特徴とする音声処理装置。
IPC (3件):
G10L 15/16 ,  G10L 11/00 ,  G10L 15/02
FI (5件):
G10L15/16 ,  G10L11/00 101E ,  G10L11/00 101Z ,  G10L11/00 201A ,  G10L15/02 300A
Fターム (1件):
5D015CC01

前のページに戻る