Pat
J-GLOBAL ID:200903014965800847

音声認識のための話者適応化方法

Inventor:
Applicant, Patent owner:
Agent (1): 草野 卓
Gazette classification:公開公報
Application number (International application number):1996063139
Publication number (International publication number):1997258770
Application date: Mar. 19, 1996
Publication date: Oct. 03, 1997
Summary:
【要約】【課題】 オフ・ラインで十分時間を掛けて音声認識を行う場合に少ない学習データ量で認識率を向上させる。【解決手段】 不特定話者モデルを用いて認識対象音声を文節単位で認識し(S2 )、不特定話者モデルを話者適応化の初期モデルとし(S3 )、認識結果の各候補の尤度と比較し、1位と2位の候補間の尤度差が2位以下の候補間の各尤度差に比べ大きいものを教師信号として選択し(S4 )、その教師信号と対応した認識対象音声のみを用いて話者適応化処理を行い(S5 )、適応化されたモデルを用いてステップS2 〜S5 を、認識結果が前回と同じになるか、制限時間を経過するまで繰り返す。
Claim (excerpt):
同一話者が発声した録音済みの認識対象音声を音響モデルを用いて認識する第1過程と、その第1過程で得られた各認識対象音声に対応する認識結果の各候補の尤度を比較し、上記認識結果の候補の1位が正解である可能性が高い上記音声を選択する第2過程と、その第2過程で選択した音声とその音声に対応する上記認識結果の候補の1位を教師信号として用いる話者適応を行い、上記認識対象音声に適応化した新しい音響モデルを作成する第3過程とを有することを特徴とする音声認識のための話者適応化方法。
IPC (2):
G10L 3/00 531 ,  G10L 3/00 551
FI (2):
G10L 3/00 531 K ,  G10L 3/00 551 B

Return to Previous Page