特許
J-GLOBAL ID:200903023265695995

音声認識装置及びその方法

発明者:
出願人/特許権者:
代理人 (1件): 岩橋 文雄 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願2000-268269
公開番号(公開出願番号):特開2002-073061
出願日: 2000年09月05日
公開日(公表日): 2002年03月12日
要約:
【要約】【課題】 本発明は音声認識技術に関するものであり、非定常騒音環境下であっても正しく音声区間検出を行うことを目的とする。【解決手段】 音声認識装置において、音声パワーとノイズパワーの比であるSN比が一定の閾値を超えるか否かで音声スイッチのON/OFFを切り替え、音声スイッチが最後にONになってからT1秒以上経過し、かつ最後にOFFになってからT2秒以上経過し、かつ認識開始後T6秒以内であって、かつ最大SN比がαdB以上であり、かつ認識対象語彙に対する最大尤度がβ以上であるときに、終了検出する手段をもつ音声認識装置。
請求項(抜粋):
音声区間を検出し音声認識を行う装置において、ノイズレベルを学習する学習手段と、前記ノイズレベルと現在のパワーの比であるSN比を求めるSN比演算手段手段と、前記SN比の最大値を保存しておく最大SN比保存手段と、認識対象語彙に対する尤度を求める尤度演算手段と、前記認識対象語彙に対する最大尤度を保存しておく最大尤度保存手段と、前記SN比が一定の閾値を超えるか否かで音声スイッチのON/OFFを検出する音声スイッチ検出手段と、前記音声スイッチの状態と前記認識対象語彙に対する最大尤度と前記最大SN比とから終了検出することで音声区間を検出する音声区間検出手段とを備えたことを特徴とする音声認識装置。
IPC (3件):
G10L 11/02 ,  G10L 15/04 ,  G10L 15/28
FI (3件):
G10L 3/00 513 A ,  G10L 3/00 571 K ,  G10L 3/00 571 H
Fターム (5件):
5D015DD03 ,  5D015DD05 ,  5D015EE05 ,  5D015EE06 ,  5D015GG01

前のページに戻る