特許
J-GLOBAL ID:201503012148666808
深度に基づく場面認識
発明者:
,
,
,
,
出願人/特許権者:
,
代理人 (1件):
特許業務法人磯野国際特許商標事務所
公報種別:公表公報
出願番号(国際出願番号):特願2015-517255
公開番号(公開出願番号):特表2015-526753
出願日: 2013年04月15日
公開日(公表日): 2015年09月10日
要約:
深度カメラから検出されたユーザの動作に基づいて、音声認識に関係づけられた適用可能な発話コマンドを取捨選択するための方法又はシステムを提供する。ユーザの手や腕の深度に応じて発話コマンドの場面が決定され、決定された場面に対応する発話コマンドを選択する。次に、選択された発話コマンドを使用して、音声信号の音声認識が行われる。発話コマンドの適切な組を使用することにより、音声認識の精度が向上する。【選択図】図5
請求項(抜粋):
各深度画像がユーザの少なくとも一部を含み、かつ該ユーザの該少なくとも一部に深度カメラからの距離を表す画素を有する深度画像の少なくとも一つを、車両内に配置した該深度カメラによって撮像するステップと、
撮像された深度画像に基づいて該ユーザのポーズ又はジェスチャを認識するステップと、
該認識されたポーズ又はジェスチャに基づいてジェスチャ情報を生成するステップと、
該ジェスチャ情報に基づいて、該ユーザが操作の対象としている可能性がある一つ又は複数の機器を複数の機器の中から決定するステップと、
操作の対象として決定された前記一つ又は複数の機器に関係づけられた複数の発話コマンドを選択するステップと、
該ユーザが該ポーズ又は該ジェスチャをとっている時に該ユーザによって発せられた発話を含む音声信号を受信するステップと、
該選択された複数の発話コマンドを使用して該音声信号の音声認識を行うことによって、該一つ又は複数の機器を操作するための機器コマンドを決定するステップと、
を含むことを特徴とする、発話コマンドを認識するコンピュータに実装される方法。
IPC (6件):
G10L 15/28
, G10L 15/00
, G06F 3/16
, G06F 3/01
, G06F 3/034
, G06T 7/20
FI (6件):
G10L15/28 230K
, G10L15/00 200Q
, G06F3/16 650
, G06F3/01 310C
, G06F3/033 422
, G06T7/20 300A
Fターム (28件):
5B087AA09
, 5B087BC32
, 5B087CC26
, 5E555AA04
, 5E555AA09
, 5E555AA64
, 5E555BA23
, 5E555BB23
, 5E555BC01
, 5E555BE10
, 5E555CA42
, 5E555CA47
, 5E555CB64
, 5E555CB66
, 5E555CC01
, 5E555EA13
, 5E555EA22
, 5E555EA25
, 5E555FA30
, 5L096AA09
, 5L096BA04
, 5L096CA04
, 5L096CA05
, 5L096FA66
, 5L096FA69
, 5L096JA03
, 5L096JA09
, 5L096JA22
引用特許:
前のページに戻る