特許
J-GLOBAL ID:200903034532336195

パターン認識方法、装置およびその記憶媒体

発明者:
出願人/特許権者:
代理人 (1件): 三好 秀和 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平9-255683
公開番号(公開出願番号):特開平10-149192
出願日: 1997年09月19日
公開日(公表日): 1998年06月02日
要約:
【要約】【課題】 各混合要素分布に表現能力が高く、計算コストが低い分布を配置し、各状態の混合要素分布数が少なくても認識性能が高く、出力確率の計算コストが少ない確率モデルを用いたパターン認識方法、装置およびその記憶媒体を提供すること。【解決手段】 入力音声信号がA/D変換部42で変換されたディジタル信号から入力音声特徴ベクトルを音声特徴ベクトル抽出部43で抽出するとともに、モデル学習用音声データ記憶部47に記憶されたモデル学習用音声データから音声特徴ベクトル抽出部48で抽出した音声特徴ベクトルを用いて連続混合分布型モデルを学習して離散混合分布型モデルの初期モデルを初期モデル生成部49で生成し、この生成された初期モデルの離散混合分布を初期分布としてモデルパラメータの推定をモデルパラメータ推定部410で行い、このパラメータ推定結果に基づく離散混合分布型モデルを用いて入力音声特徴ベクトルの各モデルとの確率をモデル確率計算部45で計算し、最も確率の高いモデルのカテゴリを認識結果として出力する。
請求項(抜粋):
認識カテゴリの特徴を表現した確率モデルとして、各認識カテゴリの特徴ベクトルが存在する特徴量空間を、各次元に配置した任意の分布形状の1次元離散分布の混合分布を用いて表現した確率モデルを用いて、各確率モデルの各入力信号から求められた入力特徴ベクトルに対する確率を計算するステップと、複数の確率モデル中で最も確率の高い確率モデルが表現する認識カテゴリを認識結果として出力するステップと、を有することを特徴とするパターン認識方法。
IPC (3件):
G10L 3/00 535 ,  G10L 3/00 515 ,  G06T 7/00
FI (3件):
G10L 3/00 535 ,  G10L 3/00 515 B ,  G06F 15/70 465 A

前のページに戻る