特許
J-GLOBAL ID:200903088187362024

音声区間検出装置及び音声認識装置

発明者:
出願人/特許権者:
代理人 (1件): 松田 正道
公報種別:公開公報
出願番号(国際出願番号):特願平5-086156
公開番号(公開出願番号):特開平6-301393
出願日: 1993年04月13日
公開日(公表日): 1994年10月28日
要約:
【要約】【目的】ノイズ環境下において、話者の音声の音声区間を正確に切り出すことと、音声認識率の低下を抑えることを目的とする。【構成】特徴抽出手段105が口唇画像信号から口唇の動き情報を抽出し、区間抽出部903が、その口唇の動き情報から音声区間を抽出する。音声波形切り出し部904が音声区間情報を用いて音声波形を切り出し、その切り出された音声波形により、音声認識部905が音声認識を行う。【効果】音声区間の切り出しを話者の口唇の動き情報を用いて行うため、ノイズ環境下においても正確に音声区間を切り出すことができ、この音声区間切り出しを利用して音声認識を行うため、騒音による音声認識率の低下を抑えることができる。
請求項(抜粋):
少なくとも口唇を含む顔画像を信号に変換する画像入力手段と、前記画像入力手段で変換した信号から口唇の動き情報を抽出する特徴抽出手段と、前記特徴抽出手段による口唇の動き情報から音声区間を抽出する区間抽出手段とを備えたことを特徴とする音声区間検出装置。
IPC (2件):
G10L 3/00 513 ,  G06F 15/18

前のページに戻る