特許
J-GLOBAL ID:201803018708423264
音響モデル学習装置、音響モデル学習方法、音声認識装置、および音声認識方法
発明者:
出願人/特許権者:
代理人 (4件):
前田 実
, 山形 洋一
, 佐藤 賢改
, 篠原 昌彦
公報種別:再公表公報
出願番号(国際出願番号):JP2016064981
公開番号(公開出願番号):WO2017-199416
出願日: 2016年05月20日
公開日(公表日): 2017年11月23日
要約:
この発明の音響モデル学習装置は、話者毎の各特徴ベクトルから話者毎の全ての特徴ベクトルの平均ベクトルを減算して作成した話者毎の学習データと、全話者の各特徴ベクトルから全話者の全ての特徴ベクトルの平均ベクトルを減算して作成した全話者の学習データとを用いて音響モデルを学習するので、第1発話目に対しても認識終了時間の遅延なしに認識精度を確保した音響モデルを学習することができる。また、この発明の音声認識装置は、入力された音声が第1発話目であれば、全話者の全ての特徴ベクトルの平均ベクトルを補正ベクトルとして、入力された音声の特徴ベクトルから補正ベクトルを減算した補正後ベクトルを前記音響モデルと照合するので、第1発話目に対しても認識終了時間の遅延なしに音声認識の精度を確保することができる。
請求項(抜粋):
複数の話者の発話データを分析して得た特徴ベクトルに対して、話者毎の各前記特徴ベクトルから話者毎の全ての前記特徴ベクトルの平均ベクトルを減算して話者毎の学習データを作成する話者毎学習データ作成手段と、
全話者の各前記特徴ベクトルから全話者の全ての前記特徴ベクトルの平均ベクトルを減算して全話者の学習データを作成する全話者学習データ作成手段と、
前記話者毎の学習データと前記全話者の学習データとを用いて音響モデルを学習する学習手段と
を備えたことを特徴とする音響モデル学習装置。
IPC (2件):
FI (2件):
G10L15/07
, G10L15/06 300G
引用特許:
前のページに戻る