Pat
J-GLOBAL ID:200903051812241361

音声認識装置

Inventor:
Applicant, Patent owner:
Agent (1): 藤村 元彦
Gazette classification:公開公報
Application number (International application number):2000276123
Publication number (International publication number):2002091466
Application date: Sep. 12, 2000
Publication date: Mar. 27, 2002
Summary:
【要約】【課題】 例え雑音環境下にあっても、誤った音声認識による誤操作処理を防止させることが出来る音声認識装置を提供することを目的とする。【解決手段】 音声入力対象者(使用者)が発した音声信号レベルに基づいて求めた発話区間と、音声入力対象者の口を撮影して得た口画像データに基づいて求めた発話区間とが略一致している場合に限り、音声認識結果としての音声操作語句データを出力する。
Claim (excerpt):
音声入力対象者が発する音声を認識する音声認識装置であって、前記音声に対応した音声信号に対して音声認識処理を施すことにより前記音声による語句を示す音声語句データを得る音声認識手段と、前記音声信号の信号レベルに基づいて前記音声入力対象者が発話を開始した時点及び前記発話を終了した時点を夫々検出して発話区間を示す第1発話区間情報を生成する第1発話区間検出手段と、前記音声入力対象者の口部分を撮影して口画像データを得る口画像撮影手段と、前記口画像データに基づいて前記音声入力対象者が発話を開始した時点及び前記発話を終了した時点を夫々検出して発話区間を示す第2発話区間情報を生成する第2発話区間検出手段と、前記第1発話区間情報と前記第2発話区間情報とが近似している場合に限り前記音声語句データを出力する音声認識出力制御手段と、を有することを特徴とする音声認識装置。
IPC (6):
G10L 11/02 ,  G10L 15/04 ,  G10L 15/00 ,  G10L 15/28 ,  G10L 15/24 ,  G10L101:065
FI (6):
G10L101:065 ,  G10L 3/00 513 B ,  G10L 3/00 513 A ,  G10L 3/00 551 Q ,  G10L 3/00 561 H ,  G10L 3/00 571 Q
F-Term (4):
5D015DD03 ,  5D015KK01 ,  5D015LL02 ,  5D015LL07
Patent cited by the Patent:
Cited by examiner (7)
Show all

Return to Previous Page