特許
J-GLOBAL ID:200903099298670234

単語認識装置

発明者:
出願人/特許権者:
代理人 (1件): 佐藤 幸男 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平10-103366
公開番号(公開出願番号):特開平11-149296
出願日: 1998年03月31日
公開日(公表日): 1999年06月02日
要約:
【要約】【課題】 高雑音下であっても十分な単語認識を行うことのできる単語認識装置を実現する。【解決手段】 唇追跡部102は、画像入力部101より入力された顔画像から唇の動きを追跡し、口の開き具合を求める。谷抽出部104は、前処理部103で処理した口の開き具合の時間的変化を波形で表した場合の谷部分を抽出する。谷種別判定部105は、判定用パラメータに基づき、発話単語の谷種別の系列を判定する。マッチング実行部106は、谷種別判定部105で判定した発話単語の谷種別の系列に最も近い候補単語を、発話単語の認識結果として出力部109に出力する。
請求項(抜粋):
顔画像から上唇と下唇それぞれの動きを追跡し、口の開き具合を求める唇追跡部と、前記唇追跡部で求めた口の開き具合の時間的変化から、発話単語の特徴を抽出する特徴抽出部と、予め設けられた種別分類用のパラメータに基づき、前記発話単語が、どの種別の系列かを分類する分類部と、種別の系列をデータとしてそれぞれ有する候補単語を格納する候補単語記憶部と、前記分類された発話単語の種別の系列がどの候補単語の種別の系列に最も近いかを判定し、最も近い候補単語を前記発話単語の認識結果とするマッチング実行部とを備えたことを特徴とする単語認識装置。
IPC (2件):
G10L 3/00 571 ,  G06T 1/00
FI (2件):
G10L 3/00 571 G ,  G06F 15/62 380

前のページに戻る