特許
J-GLOBAL ID:200903095066347954

音声認識装置、音声認識方法及び音声認識方法を記録した媒体

発明者:
出願人/特許権者:
代理人 (1件): 石田 敬 (外4名)
公報種別:公開公報
出願番号(国際出願番号):特願2000-071067
公開番号(公開出願番号):特開2001-255887
出願日: 2000年03月09日
公開日(公表日): 2001年09月21日
要約:
【要約】【課題】 話者が交代したことを迅速に認識することを可能とした音声認識装置等を提供する。【解決手段】 周波数分析部12からは音声のスペクトラムの特徴を示す音響特徴量が出力され、この音響特徴量に基づいて最大尤度GMM選択部41に予め記憶されているGMMの尤度が算出される。そして、最大尤度を与えるGMMが選択され、最適HMM選択部42においてこれに対応するHMMが選択され、音素認識部13における音素認識に使用される。音素列は単語・文章認識部15において辞書16を使用して、単語あるいは文章に構成される。
請求項(抜粋):
音声信号を周波数分析し、周波数スペクトラムの特徴を表す音響特徴量を時系列データとして出力する周波数分析手段と、前記周波数分析手段から出力される音響特徴量に対応する予め記憶されている混合ガウス分布モデルの尤度を算出し、最大平均尤度を与える混合ガウス分布モデルを最尤混合ガウス分布モデルとして選択する最尤混合ガウス分布モデル選択手段と、前記最尤混合ガウス分布モデル選択手段で選択された最尤混合ガウス分布モデルに対応する隠れマルコフモデルを最適隠れマルコフモデルとして予め記憶されている隠れマルコフモデルの中から選択する最適隠れマルコフモデル選択手段と、前記最適隠れマルコフモデル選択手段で選択された最適隠れマルコフモデルを使用して前記周波数分析手段から出力される音響特徴量に基づいて音素を認識し、音素列データとして出力する音素認識手段と、前記音素認識手段から出力される音素列データを予め記憶されている辞書を使用して単語又は文章を構成する単語・文章構成手段と、を具備する音声認識装置。
IPC (4件):
G10L 15/14 ,  G10L 15/06 ,  G10L 15/10 ,  G10L 17/00
FI (4件):
G10L 3/00 535 C ,  G10L 3/00 521 S ,  G10L 3/00 531 K ,  G10L 3/00 545 A
Fターム (4件):
5D015AA03 ,  5D015HH04 ,  9A001GG21 ,  9A001HH17

前のページに戻る