特許
J-GLOBAL ID:200903047560146916

音声認識装置及び方法

発明者:
出願人/特許権者:
代理人 (1件): 鈴江 武彦
公報種別:公開公報
出願番号(国際出願番号):特願平5-114970
公開番号(公開出願番号):特開平6-324696
出願日: 1993年05月17日
公開日(公表日): 1994年11月25日
要約:
【要約】【目的】本発明は、発声の長さの違う語彙間の誤認識を減らすことにより認識率を向上させることができる音声認識装置及び方法を提供することを目的とする。【構成】本発明は、音声信号をA/D変換器1で変換したデジタルデータ中から音声部分の範囲を出力する音声切り出し装置2と、この音声切り出し装置2から出力された音声部分の範囲をフレーム設定してフレーム情報を出力すると共に音声の長さ特徴パラメータを出力するフレーム合成装置8と、このフレーム合成装置8で設定されたフレーム毎に周波数特徴パラメータを求める特徴パラメータ演算装置5と、この特徴パラメータ演算装置5により求めた周波数特徴パラメータと前記フレーム合成装置8から出力された音声の長さ特徴パラメータが入力層に入力され最大発火した出力層ニューロン素子に対応した語彙を認識結果として出力するニューラル・ネットワーク9とを具備して構成する。
請求項(抜粋):
アナログの音声信号をデジタルデータに変換するA/D変換手段と、このA/D変換手段により変換されたデジタルデータ中から音声部分の範囲を出力する音声切り出し手段と、この音声切り出し手段から出力された音声部分の範囲をフレーム設定してフレーム情報を出力すると共に該音声部分の音声の長さである音声長特徴パラメータを出力するフレーム合成手段と、このフレーム合成手段で設定されたフレーム毎に音声の特徴である音声特徴パラメータを求める演算手段と、この演算手段により求めた音声特徴パラメータと前記フレーム合成手段から出力された音声長特徴パラメータから音声を認識する認識手段とを具備することを特徴とする音声認識装置。
IPC (3件):
G10L 9/10 301 ,  G06F 15/18 ,  G10L 3/02
引用特許:
審査官引用 (12件)
  • 特開平1-136196
  • 特開平1-291298
  • 特開昭63-205698
全件表示

前のページに戻る