特許
J-GLOBAL ID:200903021182012656

音声区間検出装置及び方法並びに音声認識システム

発明者:
出願人/特許権者:
代理人 (6件): 吉武 賢次 ,  橘谷 英俊 ,  佐藤 泰和 ,  吉元 弘 ,  川崎 康 ,  出口 智也
公報種別:公開公報
出願番号(国際出願番号):特願2006-329871
公開番号(公開出願番号):特開2007-156493
出願日: 2006年12月06日
公開日(公表日): 2007年06月21日
要約:
【課題】多様な雑音が存在する実際環境で音声認識エラーの主要な原因として提起されている動的雑音を効果的に除去できる音声区間検出装置及び方法並びに音声認識システムを提供する。【解決手段】音響受信部及び映像受信部を備える音声区間検出装置において、 前記映像受信部から出力される映像フレームで動き領域を検出し、前記検出された動き領域に唇動き映像特徴情報を適用して唇動き信号を検出する唇動き信号検出部と、前記音響受信部から出力される音響フレームと、前記唇動き信号検出部で検出された唇動き信号を用いて音声区間を検出する音声区間検出部と、を備える。【選択図】図2
請求項(抜粋):
音響受信部及び映像受信部を備える音声区間検出装置において、 前記映像受信部から出力される映像フレームで動き領域を検出し、前記検出された動き領域に唇動き映像特徴情報を適用して唇動き信号を検出する唇動き信号検出部と、 前記音響受信部から出力される音響フレームと、前記唇動き信号検出部で検出された唇動き信号を用いて音声区間を検出する音声区間検出部と、を備えることを特徴とする音声区間検出装置。
IPC (2件):
G10L 15/04 ,  G10L 15/24
FI (4件):
G10L15/04 300Z ,  G10L15/04 300A ,  G10L15/04 300B ,  G10L15/24 Q
Fターム (1件):
5D015DD03
引用特許:
出願人引用 (2件)
  • 米国特許公開US6,185,529B1号明細書
  • 大韓民国特許公開第2005-0015585号明細書
審査官引用 (4件)
  • 音声認識装置
    公報種別:公開公報   出願番号:特願2000-276123   出願人:パイオニア株式会社
  • 音声区間検出装置および方法
    公報種別:公開公報   出願番号:特願2003-401418   出願人:三星電子株式会社
  • 携帯端末
    公報種別:公開公報   出願番号:特願2003-058638   出願人:ヤマハ株式会社
全件表示
引用文献:
前のページに戻る