特許
J-GLOBAL ID:200903014863901720

ワードスポッティング音声認識装置

発明者:
出願人/特許権者:
代理人 (1件): 草野 卓
公報種別:公開公報
出願番号(国際出願番号):特願平4-264874
公開番号(公開出願番号):特開平6-118990
出願日: 1992年10月02日
公開日(公表日): 1994年04月28日
要約:
【要約】【目的】 不正解候補の湧き出しおよび正解候補の脱落を防止する。【構成】 認識尤度計算部9から出力される認識候補に対して、認識候補の始端位置の音声区間判定部3により判定された音声信号区間の始端位置に対する時間的な早さが予め設定されている許容時間より大きいか、或は認識候補の終端位置の音声区間判定部により判定された音声信号区間の終端位置に対する時間的な遅さが予め設定されている許容時間より大きいか、或は認識候補の始端位置が音声区間判定部3により判定された音声信号区間の終端位置より時間的に遅いか或は認識候補の終端位置が音声区間判定部3により判定された音声信号区間の始端位置より時間的に早い場合は、当該認識候補のリジェクトを行なう候補リジェクト部15を具備するワードスポッティング音声認識装置。
請求項(抜粋):
認識処理の対象となる単語の指定、指定解除を個々の単語に対して独立に実施する認識対象設定部を具備し、入力信号の分析を行ない認識尤度計算用の特微量および音声区間検出用の特微量を計算する音声分析部を具備し、音声分析部において計算された音声区間検出用の特微量に基づいて入力信号区間における音声信号区間の始端位置および終端位置を判定する音声区間判定部を具備し、音声分析部において計算された認識尤度計算用の特微量を記憶する尤度計算用特微量記憶部を具備し、音声分析部において計算された認識尤度計算用の特微量或は尤度計算用特微量記憶部に記憶されている任意の入力区間に対応する認識尤度計算用の特微量と、入力信号の任意の部分的信号区間において認識対象設定部により指定された認識対象単語とに基づいて、認識尤度を計算し、認識結果として単語毎に予め設定されているしきい値以上の認識尤度を持ち、候補の区間長が単語毎に予め設定されている範囲の長さ内である認識候補の認識単語番号、認識尤度、および入力信号区間におけるスポッティングされた始端位置および終端位置を出力する認識尤度計算部を具備するワードスポッティング音声認識装置において、更に認識尤度計算部から出力される認識候補に対して、認識候補の始端位置の音声区間判定部により判定された音声信号区間の始端位置に対する時間的な早さが予め設定されている許容時間より大きいか、或は認識候補の終端位置の音声区間判定部により判定された音声信号区間の終端位置に対する時間的な遅さが予め設定されている許容時間より大きいか、或は認識候補の始端位置が音声区間判定部により判定された音声信号区間の終端位置より時間的に遅いか或は認識候補の終端位置が音声区間判定部により判定された音声信号区間の始端位置より時間的に早い場合は、当該認識候補のリジェクトを行なう候補リジェクト部を具備する、ことを特徴とするワードスポッティング音声認識装置。
IPC (3件):
G10L 3/00 561 ,  G10L 3/00 515 ,  G10L 3/00 531

前のページに戻る