特許
J-GLOBAL ID:200903085792551093

自動口形状検出装置とそれを用いた自動単語認識装置

発明者:
出願人/特許権者:
代理人 (1件): 井桁 貞一
公報種別:公開公報
出願番号(国際出願番号):特願2001-100023
公開番号(公開出願番号):特開2002-197465
出願日: 2001年03月30日
公開日(公表日): 2002年07月12日
要約:
【要約】【課題】 騒音下などで発話された発話意図や単語を認識するために、発話者の口の形状を検出するのに好適な汎用性の高い口形状検出装置と、また口の形状変化から発話された単語を認識する単語認識装置を提供する。【解決手段】 発話者の顔面をカラー撮像して取得した画素の色情報と、予め取得した顔面部位の正規化した色情報との比較をして、撮像データを肌・唇・口腔・歯の領域に分割する。取得した口腔と歯領域とを合成して唇の内周輪郭を算出し口形状を検出する。また単語を発する発話者の変化する口唇部をカラー撮像して動画像列を得、固有空間法で求めた固有画像が取得した口唇画像中に含まれる割合の時間応答特性を用いて、発話単語の応答特性と予め辞書登録されている単語の応答特性とを比較し、類似単語を識別して発話単語を認識する。
請求項(抜粋):
カラー撮像して検出対象の顔面画像データを取得する撮像部と、前記顔面画像データの各画素の画素データを、色成分データと輝度成分データとに分離して格納する画像入力部と、前記色成分データを前記輝度成分データで正規化し輝度正規化色情報データに変換して格納する色情報算出部と、前記輝度成分データと前記輝度正規化色情報データとに基づいて、前記検出対象顔面全域の各部位の画素を特定する部位領域データに分割処理して格納する領域分割部と、前記部位領域データから唇内周領域算出処理をおこなって前記唇の内周輪郭領域データを抽出して格納する口輪郭検出部とを備えることを特徴とする自動口形状検出装置。
IPC (6件):
G06T 7/20 300 ,  G06T 1/00 340 ,  G06T 7/00 100 ,  G10L 11/02 ,  G10L 15/04 ,  G10L 15/24
FI (5件):
G06T 7/20 300 B ,  G06T 1/00 340 A ,  G06T 7/00 100 A ,  G10L 3/00 513 Z ,  G10L 3/00 571 G
Fターム (34件):
5B057AA20 ,  5B057BA11 ,  5B057CA01 ,  5B057CA08 ,  5B057CA12 ,  5B057CA16 ,  5B057CB17 ,  5B057CC03 ,  5B057CE09 ,  5B057CE12 ,  5B057DC03 ,  5B057DC04 ,  5B057DC25 ,  5D015LL07 ,  5L096AA02 ,  5L096AA06 ,  5L096BA08 ,  5L096BA16 ,  5L096BA18 ,  5L096CA04 ,  5L096DA02 ,  5L096EA12 ,  5L096EA18 ,  5L096EA37 ,  5L096EA43 ,  5L096FA06 ,  5L096FA59 ,  5L096FA66 ,  5L096FA69 ,  5L096GA40 ,  5L096HA04 ,  5L096HA08 ,  5L096HA13 ,  5L096JA11

前のページに戻る