特許
J-GLOBAL ID:201403062034570842

識別的音声認識精度推定装置、識別的音声認識精度推定方法、プログラム

発明者:
出願人/特許権者:
代理人 (3件): 中尾 直樹 ,  中村 幸雄 ,  義村 宗洋
公報種別:公開公報
出願番号(国際出願番号):特願2012-187708
公開番号(公開出願番号):特開2014-044363
出願日: 2012年08月28日
公開日(公表日): 2014年03月13日
要約:
【課題】認識精度の推定値を高精度で得ることができる識別的音声認識精度推定装置を提供する。【解決手段】入力された音声を音声認識して、当該音声認識結果を出力する音声認識部と、音声認識結果から得られる情報に基づいて単語特徴量ベクトルを作成する単語特徴量ベクトル作成部と、セグメント内で最大の存在確率を持つ単語を連結して生成した単語列(1-best認識結果単語列)中のεを含む各単語の単語特徴量ベクトルと、予め学習された認識結果単語確率的分類モデルとを用いて、1-best認識結果単語列中のεを含む各単語が正解である確率、置換誤りである確率、挿入誤りである確率、削除誤りである確率、εである確率をセグメント毎に表記した確率的単語分類結果を生成する認識結果単語確率的分類部とを備え、確率的単語分類結果を用いて音声認識精度を計算することを特徴とする。【選択図】図13
請求項(抜粋):
入力された音声を音声認識して、当該音声認識結果を出力する音声認識部と、 前記音声認識結果から得られる情報に基づいて単語特徴量ベクトルを作成する単語特徴量ベクトル作成部と、 前記音声認識結果の何れかのセグメントにおいて何れの認識結果単語も存在しない確率をε(εはセグメント内に認識結果単語が存在しないことを示す記号、以下同じ)の存在確率と表記するものとし、セグメント内で最大の存在確率を持つ単語を連結して生成した単語列(以下、1-best認識結果単語列という)中のεを含む各単語の単語特徴量ベクトルと、予め学習された認識結果単語確率的分類モデルとを用いて、前記1-best認識結果単語列中のεを含む各単語が正解である確率、置換誤りである確率、挿入誤りである確率、削除誤りである確率、εである確率をセグメント毎に表記した確率的単語分類結果を生成する認識結果単語確率的分類部とを備え、 前記確率的単語分類結果を用いて音声認識精度を計算すること、 を特徴とする識別的音声認識精度推定装置。
IPC (3件):
G10L 15/18 ,  G10L 15/10 ,  G10L 15/22
FI (3件):
G10L15/18 300Z ,  G10L15/10 300F ,  G10L15/22 460Z
引用特許:
出願人引用 (1件)

前のページに戻る