特許
J-GLOBAL ID:200903010786783551

音声認識装置、音声認識に用いられる特徴ベクトルの作成方法及び音声認識方法

発明者:
出願人/特許権者:
代理人 (1件): 鈴江 武彦
公報種別:公開公報
出願番号(国際出願番号):特願平8-004013
公開番号(公開出願番号):特開平9-198080
出願日: 1996年01月12日
公開日(公表日): 1997年07月31日
要約:
【要約】【課題】類似性の高いカテゴリ間の分離性能が向上できるようにする。【解決手段】座標系決定部2では、音声を分析することで得られる第1の特徴ベクトルの空間内の類似性の高いカテゴリ同士をまとめてクラスとし、それぞれのクラスに対して、任意の方法、好ましくは主成分分析あるいは判別分析により1つの座標系を設けることで、第1の特徴ベクトルの空間に複数の座標系を設定する。特徴ベクトル作成部4では、音声分析部1により入力音声から変換された第1の特徴ベクトルを、上記設定されたそれぞれの座標系に射影することで第2の特徴ベクトルを作成し、あるいは、さらにその第2の特徴ベクトルの群を一括して1つの第3の特徴ベクトルにまとめる。モデル学習部5と認識部7では、上記第2の特徴ベクトル、あるいは第3の特徴ベクトルを入力として、それぞれ参照モデルの学習と認識を行う。
請求項(抜粋):
音声を分析して得られる第1の特徴ベクトルの形成するベクトル空間に複数の座標系を設定する座標系決定手段と、入力音声を分析し第1の特徴ベクトルを作成する音声分析手段と、この音声分析手段により作成された第1の特徴ベクトルを前記座標系決定手段により設定された複数の座標系のそれぞれで座標系成分表示することで第2の特徴ベクトル群を作成する特徴ベクトル作成手段と、学習モードにおいて、前記特徴ベクトル作成手段で作成された第2の特徴ベクトル群を用いて参照モデルを学習するモデル学習手段と、このモデル学習手段により学習された参照モデルを格納するための参照モデル格納手段と、認識モードにおいて、前記特徴ベクトル作成手段で作成された第2の特徴ベクトル群と前記参照モデル格納手段内の参照モデルを用いて認識計算を行う認識手段とを具備することを特徴とする音声認識装置。
引用特許:
審査官引用 (2件)

前のページに戻る