Pat
J-GLOBAL ID:200903047247056388

音声認識のための音声区間始端補正方法及び装置並びに音声認識方法

Inventor:
Applicant, Patent owner:
Agent (1): 光石 俊郎 (外2名)
Gazette classification:公開公報
Application number (International application number):1996068230
Publication number (International publication number):1997258765
Application date: Mar. 25, 1996
Publication date: Oct. 03, 1997
Summary:
【要約】【課題】音声区間検出において、音声区間の始端として誤検出された非定常雑音を認識対象区間から除外するために、音声区間始端の補正を行うこと。【解決手段】入力信号と単語標準パタンとの照合結果より得られる部分文の照合スコア及び構文解析結果と、無音の標準パタンと一致すると判断される入力信号の区間長とを用いて、部分文文末の無音区間に対応する区間を決定し、この時点で入力信号と当該部分文との適合度を基にそれ以前の入力が非定常雑音であるか否かを判定し、非定常雑音であると判定した場合にその時点から数フレーム以前に、音声区間の始端を補正して再度認識を行う。
Claim (excerpt):
単語標準パタンを文法規則に基づき連続的に入力信号と照合することで音声を認識する装置において、入力信号と単語標準パタンとの照合結果より得られる、部分文の照合スコアと構文解析結果、無音の標準パタンと一致すると判断される入力信号の区間長、及び、入力信号と部分文の適合度を基に非定常雑音等を検出し、音声区間の始端を補正することを特徴とする音声区間始端補正方法。
IPC (7):
G10L 3/00 513 ,  G10L 3/00 ,  G10L 3/00 521 ,  G10L 3/00 531 ,  G10L 3/00 535 ,  G10L 3/00 561 ,  G10L 5/06
FI (7):
G10L 3/00 513 B ,  G10L 3/00 513 C ,  G10L 3/00 521 L ,  G10L 3/00 531 P ,  G10L 3/00 535 ,  G10L 3/00 561 G ,  G10L 5/06 A

Return to Previous Page