Pat
J-GLOBAL ID:200903005972932130

音響モデル生成装置及び音声認識装置

Inventor:
Applicant, Patent owner:
Agent (1): 青山 葆 (外2名)
Gazette classification:公開公報
Application number (International application number):2001378546
Publication number (International publication number):2003177781
Application date: Dec. 12, 2001
Publication date: Jun. 27, 2003
Summary:
【要約】【課題】 入力音声のSN比が既知であるという制約に拘束されない音響モデルを提供する。【解決手段】 ガウス混合モデル生成部11はデータベースメモリ21に格納された学習用の複数の種類の環境雑音の波形信号データに基づいて出力尤度が最大となるように1状態で複数混合のガウス混合モデルを生成し、HMM合成部13は所定の雑音のない音声HMMと生成された雑音ガウス混合モデルからこれらの各状態の全ての組み合わせの状態において所定の重み係数で重み付けされた各ガウス分布の線形結合の和で表した各状態の混合ガウス分布を含みかつ雑音のない音声HMMと生成された雑音ガウス混合モデルの間の複数のSN比に対応する複数の適応化されたHMMを生成し、生成された複数の適応化されたHMMを並置しマルチパス形式の音響モデルを生成する。音声認識部4は抽出された特徴量に基づき上記適応化された音響モデルを用いて発話音声信号の音声認識を行う。
Claim (excerpt):
学習用の複数の種類の環境雑音の波形信号データを格納する記憶手段と、上記記憶手段に格納された学習用の複数の種類の環境雑音の波形信号データから、出力尤度が最大となるように、1状態で複数混合のガウス混合モデルを生成する生成手段と、所定の雑音のない音声隠れマルコフモデルと、上記生成手段により生成された雑音ガウス混合モデルとから、これらの各状態のすべての組み合わせの状態において、所定の重み係数で重み付けされた各ガウス分布の線形結合の和で表した各状態の混合ガウス分布を含み、かつ上記雑音のない音声隠れマルコフモデルと上記生成された雑音ガウス混合モデルの間の複数の信号対雑音比に対応する複数の適応化された隠れマルコフモデルを生成し、生成された複数の適応化された隠れマルコフモデルを並置してマルチパス形式となるように合成してなる音響モデルを生成する合成手段とを備えたことを特徴とする音響モデル生成装置。
IPC (3):
G10L 15/06 ,  G10L 15/10 ,  G10L 15/14
FI (4):
G10L 3/00 521 T ,  G10L 3/00 535 C ,  G10L 3/00 521 V ,  G10L 3/00 531 G
F-Term (4):
5D015GG05 ,  5D015HH05 ,  5D015HH06 ,  5D015HH23
Patent cited by the Patent:
Cited by examiner (3)
Article cited by the Patent:
Return to Previous Page