特許
J-GLOBAL ID:200903051812241361

音声認識装置

発明者:
出願人/特許権者:
代理人 (1件): 藤村 元彦
公報種別:公開公報
出願番号(国際出願番号):特願2000-276123
公開番号(公開出願番号):特開2002-091466
出願日: 2000年09月12日
公開日(公表日): 2002年03月27日
要約:
【要約】【課題】 例え雑音環境下にあっても、誤った音声認識による誤操作処理を防止させることが出来る音声認識装置を提供することを目的とする。【解決手段】 音声入力対象者(使用者)が発した音声信号レベルに基づいて求めた発話区間と、音声入力対象者の口を撮影して得た口画像データに基づいて求めた発話区間とが略一致している場合に限り、音声認識結果としての音声操作語句データを出力する。
請求項(抜粋):
音声入力対象者が発する音声を認識する音声認識装置であって、前記音声に対応した音声信号に対して音声認識処理を施すことにより前記音声による語句を示す音声語句データを得る音声認識手段と、前記音声信号の信号レベルに基づいて前記音声入力対象者が発話を開始した時点及び前記発話を終了した時点を夫々検出して発話区間を示す第1発話区間情報を生成する第1発話区間検出手段と、前記音声入力対象者の口部分を撮影して口画像データを得る口画像撮影手段と、前記口画像データに基づいて前記音声入力対象者が発話を開始した時点及び前記発話を終了した時点を夫々検出して発話区間を示す第2発話区間情報を生成する第2発話区間検出手段と、前記第1発話区間情報と前記第2発話区間情報とが近似している場合に限り前記音声語句データを出力する音声認識出力制御手段と、を有することを特徴とする音声認識装置。
IPC (6件):
G10L 11/02 ,  G10L 15/04 ,  G10L 15/00 ,  G10L 15/28 ,  G10L 15/24 ,  G10L101:065
FI (6件):
G10L101:065 ,  G10L 3/00 513 B ,  G10L 3/00 513 A ,  G10L 3/00 551 Q ,  G10L 3/00 561 H ,  G10L 3/00 571 Q
Fターム (4件):
5D015DD03 ,  5D015KK01 ,  5D015LL02 ,  5D015LL07
引用特許:
審査官引用 (7件)
全件表示

前のページに戻る