特許
J-GLOBAL ID:200903047247056388

音声認識のための音声区間始端補正方法及び装置並びに音声認識方法

発明者:
出願人/特許権者:
代理人 (1件): 光石 俊郎 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平8-068230
公開番号(公開出願番号):特開平9-258765
出願日: 1996年03月25日
公開日(公表日): 1997年10月03日
要約:
【要約】【課題】音声区間検出において、音声区間の始端として誤検出された非定常雑音を認識対象区間から除外するために、音声区間始端の補正を行うこと。【解決手段】入力信号と単語標準パタンとの照合結果より得られる部分文の照合スコア及び構文解析結果と、無音の標準パタンと一致すると判断される入力信号の区間長とを用いて、部分文文末の無音区間に対応する区間を決定し、この時点で入力信号と当該部分文との適合度を基にそれ以前の入力が非定常雑音であるか否かを判定し、非定常雑音であると判定した場合にその時点から数フレーム以前に、音声区間の始端を補正して再度認識を行う。
請求項(抜粋):
単語標準パタンを文法規則に基づき連続的に入力信号と照合することで音声を認識する装置において、入力信号と単語標準パタンとの照合結果より得られる、部分文の照合スコアと構文解析結果、無音の標準パタンと一致すると判断される入力信号の区間長、及び、入力信号と部分文の適合度を基に非定常雑音等を検出し、音声区間の始端を補正することを特徴とする音声区間始端補正方法。
IPC (7件):
G10L 3/00 513 ,  G10L 3/00 ,  G10L 3/00 521 ,  G10L 3/00 531 ,  G10L 3/00 535 ,  G10L 3/00 561 ,  G10L 5/06
FI (7件):
G10L 3/00 513 B ,  G10L 3/00 513 C ,  G10L 3/00 521 L ,  G10L 3/00 531 P ,  G10L 3/00 535 ,  G10L 3/00 561 G ,  G10L 5/06 A

前のページに戻る