特許
J-GLOBAL ID:201903000785206730

音声認識精度劣化要因推定装置、音声認識精度劣化要因推定方法、プログラム

発明者:
出願人/特許権者:
代理人 (3件): 中尾 直樹 ,  中村 幸雄 ,  義村 宗洋
公報種別:公開公報
出願番号(国際出願番号):特願2018-021030
公開番号(公開出願番号):特開2019-139010
出願日: 2018年02月08日
公開日(公表日): 2019年08月22日
要約:
【課題】音声認識誤りにつながる音響的な要因を推定することができる音声認識精度劣化要因推定装置を提供する。【解決手段】入力された音声からフレーム毎の音響特徴量を抽出する音響特徴量抽出部と、劣化要因クラスと非劣化要因クラスの何れかに予め分類されている複数の音響イベントに基づいて、フレーム毎の音響特徴量の音響イベント毎の事後確率を計算する事後確率計算部と、音響イベント毎の事後確率に時間方向に重みづけ係数が展開されたフィルタである時系列フィルタによるフィルタリングを行って補正事後確率とするフィルタリング部と、認識スコア付き音声認識結果の集合を出力する音声認識部と、各フレームの音声認識結果特徴量を出力する音声認識結果特徴量抽出部と、補正事後確率と、各フレームの音声認識結果特徴量と、各フレームの音響特徴量に基づいて音声認識精度の主たる劣化要因クラスをフレームごとに算出して出力する劣化要因出力部を含む。【選択図】図1
請求項(抜粋):
入力された音声からフレーム毎の音響特徴量を抽出する音響特徴量抽出部と、 劣化要因クラスと非劣化要因クラスの何れかに予め分類されている複数の音響イベントに基づいて、フレーム毎の前記音響特徴量の前記音響イベント毎の事後確率を計算する事後確率計算部と、 前記音響イベント毎の前記事後確率に時間方向に重みづけ係数が展開されたフィルタである時系列フィルタによるフィルタリングを行って補正事後確率とするフィルタリング部と、 入力された音声に対して音声認識を行い、認識スコア付き音声認識結果の集合を出力する音声認識部と、 前記認識スコア付き音声認識結果の集合の各単語の単語表記および品詞を分散表現で表される単語品詞ベクトルに変換し、当該単語品詞ベクトルに前記認識スコアの各数値を連結して音声認識結果特徴量とし、当該音声認識結果特徴量をフレームごとに出力する音声認識結果特徴量抽出部と、 前記補正事後確率と、各フレームの前記音声認識結果特徴量と、各フレームの前記音響特徴量に基づいて、音声認識精度の主たる劣化要因クラスをフレームごとに算出して出力する劣化要因出力部 を含む音声認識精度劣化要因推定装置。
IPC (2件):
G10L 15/22 ,  G10L 15/01
FI (2件):
G10L15/22 453 ,  G10L15/01 200
引用特許:
出願人引用 (3件)

前のページに戻る