特許
J-GLOBAL ID:200903014965800847

音声認識のための話者適応化方法

発明者:
出願人/特許権者:
代理人 (1件): 草野 卓
公報種別:公開公報
出願番号(国際出願番号):特願平8-063139
公開番号(公開出願番号):特開平9-258770
出願日: 1996年03月19日
公開日(公表日): 1997年10月03日
要約:
【要約】【課題】 オフ・ラインで十分時間を掛けて音声認識を行う場合に少ない学習データ量で認識率を向上させる。【解決手段】 不特定話者モデルを用いて認識対象音声を文節単位で認識し(S2 )、不特定話者モデルを話者適応化の初期モデルとし(S3 )、認識結果の各候補の尤度と比較し、1位と2位の候補間の尤度差が2位以下の候補間の各尤度差に比べ大きいものを教師信号として選択し(S4 )、その教師信号と対応した認識対象音声のみを用いて話者適応化処理を行い(S5 )、適応化されたモデルを用いてステップS2 〜S5 を、認識結果が前回と同じになるか、制限時間を経過するまで繰り返す。
請求項(抜粋):
同一話者が発声した録音済みの認識対象音声を音響モデルを用いて認識する第1過程と、その第1過程で得られた各認識対象音声に対応する認識結果の各候補の尤度を比較し、上記認識結果の候補の1位が正解である可能性が高い上記音声を選択する第2過程と、その第2過程で選択した音声とその音声に対応する上記認識結果の候補の1位を教師信号として用いる話者適応を行い、上記認識対象音声に適応化した新しい音響モデルを作成する第3過程とを有することを特徴とする音声認識のための話者適応化方法。
IPC (2件):
G10L 3/00 531 ,  G10L 3/00 551
FI (2件):
G10L 3/00 531 K ,  G10L 3/00 551 B

前のページに戻る