特許
J-GLOBAL ID:200903032023670059

音声記号化装置

発明者:
出願人/特許権者:
代理人 (1件): 草野 卓
公報種別:公開公報
出願番号(国際出願番号):特願平4-256856
公開番号(公開出願番号):特開平6-110500
出願日: 1992年09月25日
公開日(公表日): 1994年04月22日
要約:
【要約】 (修正有)【目的】 音声認識装置に用いて認識率を向上させる。【構成】 音声入力を特徴抽出部12で特徴ベクトルの時系列に変換し、特徴記憶部21に記憶する。コードブック22をニューラルネット231〜23M で構成し、23i (i=1,2,...M)特徴ベクトルs(t+1),s(t+2)を入力し、特徴ベクトルsi (t)と、差特徴ベクトルdi (t)を推定する。番号iに記号化されるべき推定値si (t),di (t)との真値s(t),d(t)との誤差が他のニューラルネット23v (vはi以外の1,2,...M)での推定値sv (t),dv (t)と真値s(t),d(t)との誤差の何れよりも小さくなるようにニューラネルット231 〜23M を学習しておく。ニューラルネットの各推定値と記憶部21からの対応真値との誤差が計算部241 〜24M で計算し、その最小誤差を選択部25で選択し、ニューラルネット23i の番号iを記号として出力する。
請求項(抜粋):
入力音声を特徴ベクトルの時系列に変換する特徴抽出手段と、上記特徴ベクトルの時系列を記憶する特徴記憶手段と、上記ベクトルの時系列の一部分からその特徴ベクトルの時系列の他の一部分を推定するニューラルネットの集合であるニューラルネットコードブックと、上記ニューラルネットごとに推定された特徴ベクトルの推定誤差を計算する推定誤差計算手段と、上記推定誤差が最小のニューラルネットの記号を出力する最小誤差選択手段と、を具備する音声記号化装置。
IPC (4件):
G10L 9/18 ,  G06F 15/18 ,  G10L 3/00 515 ,  G10L 9/10 301

前のページに戻る