特許
J-GLOBAL ID:200903092636077248

読唇装置および方法、情報処理装置および方法、検出装置および方法、プログラム、データ構造、並びに、記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 稲本 義雄
公報種別:公開公報
出願番号(国際出願番号):特願2007-154785
公開番号(公開出願番号):特開2008-310382
出願日: 2007年06月12日
公開日(公表日): 2008年12月25日
要約:
【課題】口の動きに基づいて正確に言葉を認識する。【解決手段】類似度検出部181は、口形画像におけるユーザの口形と複数の種類の基本口形との類似度を検出する。口形期間検出部191は、類似度に基づいて、初口形が出現する初口形期間、および、終口形が出現する終口形期間を検出する。基本スコア算出部192は、各期間におけるユーザの口形と各基本口形との類似度を示す基本スコアを算出する。認識部172は、基本スコアを用いて、口形辞書に登録されている各語句が、ユーザが発した言葉である確率を示す認識スコアを算出する。本発明は、口の動きに基づいて言葉を認識する読唇装置に適用できる。【選択図】図7
請求項(抜粋):
口の動きに基づいて言葉を認識する読唇装置において、 話者の口形を示す口形情報に基づいて、所定の音を発する場合に予め形作る必要がある口形であって、その音の母音に対応する口形とは異なる口形である第1の口形、および、1つの音を発し終える際に形作られる口形である第2の口形を検出する第1の口形検出手段と、 検出された前記第1の口形および前記第2の口形に基づいて、前記話者が発した言葉を認識する認識手段と を含む読唇装置。
IPC (3件):
G06T 7/20 ,  G10L 15/24 ,  G06F 3/048
FI (3件):
G06T7/20 300B ,  G10L15/24 Q ,  G06F3/048 651B
Fターム (17件):
5D015LL07 ,  5E501AA30 ,  5E501AC23 ,  5E501AC33 ,  5E501AC34 ,  5E501CB14 ,  5E501CC12 ,  5E501DA11 ,  5E501DA15 ,  5E501FA13 ,  5E501FA41 ,  5L096CA04 ,  5L096FA33 ,  5L096FA70 ,  5L096GA30 ,  5L096HA02 ,  5L096JA03
引用特許:
出願人引用 (4件)
  • 音声認識装置
    公報種別:公開公報   出願番号:特願平8-003882   出願人:沖電気工業株式会社
  • 特許第3710205号公報
  • 単語認識装置
    公報種別:公開公報   出願番号:特願平8-262396   出願人:沖電気工業株式会社
全件表示
審査官引用 (1件)

前のページに戻る