特許
J-GLOBAL ID:200903032422250500

音声認識システム

発明者:
出願人/特許権者:
代理人 (1件): 鈴江 武彦
公報種別:公開公報
出願番号(国際出願番号):特願平3-219010
公開番号(公開出願番号):特開平5-054068
出願日: 1991年08月29日
公開日(公表日): 1993年03月05日
要約:
【要約】【目的】本発明は音声の前処理部の最適化処理あるいは音声認識辞書の自由度及び構成の最適化処理を学習処理により実現する。【構成】入力音声データを音声分析部12で分析し音声特徴パラメータの時系列を求め、該音声特徴パラメータの時系列から特徴ベクトル抽出部13にて音声特徴ベクトルを求め、この音声特徴ベクトルと音声認識辞書17を照合して音声認識結果を求めるものであって、学習処理に際し管理部14により学習用音声データに対し音声分析条件又は音声分析方式を変えて複数の音声特徴パラメータを求め、これら複数の音声特徴パラメータより抽出される音声特徴ベクトル中から認識に使用する認識用特徴ベクトルを選定し、この選定された認識用特徴ベクトルを用いて音声認識辞書17を作成し、この作成された音声認識辞書17と選定された認識用特徴ベクトルとを音声認識処理に適用するようにしている。
請求項(抜粋):
入力音声データを分析して音声特徴パラメータの時系列を求めるとともに、該音声特徴パラメータの時系列から音声特徴ベクトルを抽出し、この音声特徴ベクトルと音声認識辞書とを照合することにより前記入力音声データに対する前記音声認識辞書中の音声カテゴリーの類似度を用いて音声認識結果を求めるようにした音声認識システムにおいて、学習処理に際し学習用音声データより音声分析条件又は音声分析方式を変えて複数の音声特徴パラメータを求める手段と、上記複数の音声特徴パラメータより抽出される音声特徴ベクトルの中から認識の際に使用する認識用特徴ベクトルを選定する手段と、上記選定された認識用特徴ベクトルを用いて前記音声認識辞書を作成する手段とを具備し、該生成された音声認識辞書と前記選定された認識用特徴ベクトルを前記音声認識処理に適用することを特徴とする音声認識システム。
IPC (2件):
G06F 15/38 ,  G06F 3/16 320
引用特許:
審査官引用 (2件)
  • 特開平3-167600
  • 特開平3-167600

前のページに戻る