特許
J-GLOBAL ID:200903029740788136

情報処理装置および方法、並びにプログラム

発明者:
出願人/特許権者:
代理人 (1件): 稲本 義雄
公報種別:公開公報
出願番号(国際出願番号):特願2005-284521
公開番号(公開出願番号):特開2007-094104
出願日: 2005年09月29日
公開日(公表日): 2007年04月12日
要約:
【課題】ユーザが発した音声の認識処理を良好にする。【解決手段】S31で、音声が入力されるまで待機し、音声が入力されたとき、S32に進み、ユーザの映像からの所定の部分の動きパターンの検出結果が供給されたか否かが判定され、供給されたと判定された場合、S33に進み、供給された動きパターンが、発話時の動きのパターンであるか否かが判定される。S33で、発話時の動きのパターンであると判定された場合、S34に進み、発話があった旨が、音声認識部に通知される。音声認識部は、その通知を受けると、供給される音声の音声認識を開始する。【選択図】 図4
請求項(抜粋):
音声を入力する音声入力手段と、 映像を入力する映像入力手段と、 前記映像入力手段により入力された映像から、話者の体の複数部分の動きを検出する検出手段と、 前記検出手段により検出された前記動きが、発話時の動きであるか否かを判定する判定手段と、 前記判定手段による判定結果に基づいて、前記音声入力手段により入力された前記音声を認識する音声認識手段と を備える情報処理装置。
IPC (4件):
G10L 15/24 ,  G06F 3/16 ,  G06T 1/00 ,  G06T 7/20
FI (4件):
G10L3/00 571Q ,  G06F3/16 320A ,  G06T1/00 340A ,  G06T7/20 300B
Fターム (15件):
5B057BA02 ,  5B057DA08 ,  5B057DA12 ,  5B057DB02 ,  5B057DC08 ,  5B057DC25 ,  5B057DC32 ,  5D015AA01 ,  5D015AA02 ,  5L096BA16 ,  5L096CA04 ,  5L096DA02 ,  5L096FA15 ,  5L096GA38 ,  5L096HA04
引用特許:
出願人引用 (2件)
  • US20040243416 A1 G10L 20041202 Speech recognition
  • US20030048930 A1 G06K 20030313 KABUSHIKI KAISHA TOSHIBA Image recognition apparatus and method
審査官引用 (2件)
引用文献:
審査官引用 (7件)
全件表示

前のページに戻る