特許
J-GLOBAL ID:201003052905776254

ジェスチャー/音声統合認識システム及び方法

発明者:
出願人/特許権者:
代理人 (2件): 谷 義一 ,  阿部 和夫
公報種別:公表公報
出願番号(国際出願番号):特願2009-540141
公開番号(公開出願番号):特表2010-511958
出願日: 2007年12月03日
公開日(公表日): 2010年04月15日
要約:
本発明はジェスチャー/音声統合認識システム及び方法に関し、雑音環境下における音声とジェスチャーの統合を通じて命令語の認識の性能を高めるために入力された音声の中から命令語の始点と終点を検出し音声特徴情報を抽出する音声特徴抽出部と、前記検出した始点と終点に関する情報を用いて撮影映像のジェスチャーから命令区間を検出し、ジェスチャー特徴情報を抽出するジェスチャー特徴抽出部と、前記抽出された音声特徴情報とジェスチャー特徴情報を既設定の学習パラメーターを用いて統合認識データとして出力する統合認識部を含んで構成され、簡単に、且つ正確にユーザーの命令を認識することができる。
請求項(抜粋):
入力された音声の中から命令語の始点と終点を検出し音声特徴情報を抽出する音声特徴抽出部と、 前記検出した始点と終点に関する情報を利用して撮影映像のジェスチャーから命令区間を検出し、ジェスチャー特徴情報を抽出するジェスチャー特徴抽出部と、 前記抽出した音声特徴情報とジェスチャー特徴情報を既設定の学習パラメーターを用いて統合認識データとして出力する統合認識部を含むことを特徴とするジェスチャー/音声統合認識システム。
IPC (4件):
G06F 3/16 ,  G10L 15/00 ,  G10L 15/10 ,  G06F 3/01
FI (4件):
G06F3/16 320A ,  G10L15/00 200Z ,  G10L15/10 200W ,  G06F3/01
Fターム (5件):
5D015AA04 ,  5E501BA14 ,  5E501CB14 ,  5E501CB15 ,  5E501CC11
引用特許:
審査官引用 (2件)

前のページに戻る