特許
J-GLOBAL ID:200903016615277486

音声区間検出方法

発明者:
出願人/特許権者:
代理人 (1件): 小笠原 吉義 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平9-060236
公開番号(公開出願番号):特開平10-254476
出願日: 1997年03月14日
公開日(公表日): 1998年09月25日
要約:
【要約】【課題】背景雑音が非定常な信号である場合や,雑音環境下においても正確な音声認識を可能とするため,入力信号中から音声区間を正確に自動検出する。【解決手段】認識対象語彙(クラス)を網羅する全ての音声を用いて学習した音声音響モデルと,音声の発声されていない区間を用いて学習した非音声音響モデルとを用い,入力信号の適当な区間長ごとに音声音響モデルと非音声音響モデルの尤度比を計算する。その尤度比があるしきい値を越えた区間が一定時間継続した場合に,その区間の始端,またはその区間の始端から一定時間さかのぼった時点を音声区間の始端とし,その後,尤度比があるしきい値を下回る区間が一定時間継続した場合に,その下回る区間の始端,またはその始端から一定時間経過した時点を音声区間の終端として検出する。
請求項(抜粋):
機械による自動音声認識において入力信号中から音声区間を検出する方法であって,認識対象語彙を網羅する全ての音声を用いて学習した音声音響モデルと,音声の発声されていない区間を用いて学習した非音声音響モデルとを具備し,入力信号の適当な区間長ごとに音声音響モデルと非音声音響モデルの尤度比を計算し,尤度比があるしきい値を越えた区間が一定時間継続した場合に,その区間の始端を音声区間の始端とし,その後,尤度比があるしきい値を下回る区間が一定時間継続した場合に,その始端を音声区間の終端として検出することを特徴とする音声区間検出方法。
引用特許:
審査官引用 (6件)
全件表示

前のページに戻る