特許
J-GLOBAL ID:200903045762646896
音声認識装置の音声認識精度評価方法
発明者:
出願人/特許権者:
,
,
代理人 (3件):
吉田 茂明
, 吉竹 英俊
, 有田 貴弘
公報種別:公開公報
出願番号(国際出願番号):特願2002-182842
公開番号(公開出願番号):特開2004-029215
出願日: 2002年06月24日
公開日(公表日): 2004年01月29日
要約:
【課題】自動車の走行時の環境を模擬して混合音データを生成する。【解決手段】肉声1として与えられる一連の語彙中、最初の単語要素の発音に要すると予想される予想時間(0.6秒間)より短いサンプリング時間(0.5秒間)に限定して、音声データ1aの有音部分のみをサンプルデータとして摘出し、このサンプルデータから第1の音パワー値を求め、この第1の音パワー値と雑音データ2aの第2の音パワー値に基づいて、例えば自動車の実際の走行環境等の所望の信号対雑音比に対応した両音データの混合比率kを求め、その混合比率kに従って混合音データを生成する。無音部分を含まない状態の音パワー値で混合比率kを決定でき、正確な混合比率kを得ることができる。【選択図】 図1
請求項(抜粋):
肉声とノイズとを混合して音声認識装置に入力し、当該音声認識装置の音声認識精度を評価する音声認識精度評価方法であって、
前記肉声を音声データとして収録する第1の工程と、
前記ノイズを雑音データとして収録する第2の工程と、
前記音声データ中の一部の有音部分のみからなるサンプルデータについて第1の音声パワー値を演算する第3の工程と、
前記雑音データの第2の音パワー値を演算する第4の工程と、
前記第1の音パワー値及び第2の音パワー値に基づいて、予め設定された信号対雑音比に対応した前記音声データと前記雑音データの混合比率を決定する第5の工程と、
前記混合比率で前記サンプルデータと前記雑音データとを混合した混合音データを前記音声認識装置に入力し、当該音声認識装置の音声認識精度を評価する第6の工程と
を備え、
前記サンプルデータは、前記肉声として与えられる一連の語彙中の最初の単語要素の発音に要すると予想される予想時間より短く設定された所定のサンプリング時間に限定して音声データの有音部分を摘出して生成されることを特徴とする音声認識装置の音声認識精度評価方法。
IPC (1件):
FI (1件):
Fターム (1件):
前のページに戻る