特許
J-GLOBAL ID:201703019852194589

音声認識装置、誤り修正モデル学習方法、及びプログラム

発明者:
出願人/特許権者:
代理人 (2件): 志賀 正武 ,  高橋 詔男
公報種別:特許公報
出願番号(国際出願番号):特願2012-225330
公開番号(公開出願番号):特開2014-077882
特許番号:特許第6051004号
出願日: 2012年10月10日
公開日(公表日): 2014年05月01日
請求項(抜粋):
【請求項1】 複数の言語モデルを混合重みに従って混合した混合モデルに基づいて得られる言語スコアを、重み付けされた言語的な特徴により修正した値を用いて音声認識のスコアを算出する式である誤り修正モデルを格納する誤り修正モデル格納部と、 入力された音声データを前記誤り修正モデル格納部に格納されている前記誤り修正モデルを用いて音声認識し、音声認識の結果得られた正解文候補を出力する音声認識部と、 前記音声認識部から出力された前記正解文候補をユーザ入力に従って修正し、正解単語列を生成する誤り修正部と、 前記誤り修正部が生成した前記正解単語列に含まれる各単語を前記音声データに基づいて時刻順に整列させる整列部と、 前記正解文候補と前記整列された正解単語列とから言語的な特徴を抽出する特徴量抽出部と、 前記特徴量抽出部により抽出された前記言語的な特徴と、前記正解文候補及び前記整列された正解単語列の音響スコア及び言語スコアとに基づいて前記言語的な特徴の重み及び前記言語モデルの混合重みを統計的に算出し、前記誤り修正モデル格納部に格納されている前記誤り修正モデルを、算出した前記言語的な特徴の重み及び前記言語モデルの混合重みを用いた誤り修正モデルに更新するモデルパラメータ学習部と、 を備えることを特徴とする音声認識装置。
IPC (4件):
G10L 15/22 ( 200 6.01) ,  G10L 15/197 ( 201 3.01) ,  G10L 15/10 ( 200 6.01) ,  G10L 15/183 ( 201 3.01)
FI (4件):
G10L 15/22 470 F ,  G10L 15/197 ,  G10L 15/10 300 G ,  G10L 15/183 200 K

前のページに戻る