特許
J-GLOBAL ID:200903083343911724

最適音声認識方式判定装置、音声認識装置、パラメータ算出装置、情報端末装置、及びコンピュータプログラム

発明者:
出願人/特許権者:
代理人 (1件): 清水 敏
公報種別:公開公報
出願番号(国際出願番号):特願2006-026866
公開番号(公開出願番号):特開2007-206501
出願日: 2006年02月03日
公開日(公表日): 2007年08月16日
要約:
【課題】 テスト発話なしで音声認識の精度を予測できるようにする。【解決手段】 雑音を含む音声に対し、複数の音声認識方式のうちで最も精度が高い音声認識が可能であると予測される方式を判定するための最適音声認識方式選択装置は、入力音声から所定の音響特徴量ベクトルを算出する特徴量算出部180と、変換行列でこの音響特徴量ベクトルを次元数の小さな特徴量ベクトルに変換する変換処理部182と、変換後の特徴量ベクトルと予め準備されていた重回帰係数とを用いて、音声認識の精度を音声認識方式毎に予測する予測精度算出部184と、最も高い精度で音声認識が可能な音声認識方式を選択する最大値選択部185とを含む。【選択図】 図6
請求項(抜粋):
雑音が存在する可能性のある環境下で入力された音声に対し、予め定められた複数の音声認識方式のうちで最も精度が高い音声認識が可能であると予測される方式を判定するための最適音声認識方式選択装置であって、 入力される音声から、所定の複数種類の音響特徴量を成分とする特徴量ベクトルを算出するための手段と、 予め算出された変換行列を用い、前記特徴量ベクトルをより次元数の小さな特徴量ベクトルに変換するための変換手段と、 前記変換手段による変換後の特徴量ベクトルと、前記複数の音声認識方式ごとに予め準備されていた、精度予測のための係数ベクトルとの間の所定の演算により、前記音声に対する音声認識の精度を音声認識方式ごとに予測するための精度予測手段と、 前記精度予測手段により算出された予測に基づき、最も高い精度で音声認識が可能である音声認識方式を選択するための手段とを含む、最適音声認識方式選択装置。
IPC (2件):
G10L 15/28 ,  G10L 15/06
FI (7件):
G10L15/28 220Z ,  G10L15/28 370Z ,  G10L15/06 500L ,  G10L15/28 370E ,  G10L15/28 370F ,  G10L15/28 370G ,  G10L15/06 400V
Fターム (4件):
5D015FF03 ,  5D015GG00 ,  5D015HH13 ,  5D015HH14

前のページに戻る