Pat
J-GLOBAL ID:200903015964011284

音声処理装置、音声処理方法、及びその方法を実施するためのプログラムを記録した記録媒体

Inventor:
Applicant, Patent owner:
Agent (1): 倉内 義朗
Gazette classification:公開公報
Application number (International application number):2001215451
Publication number (International publication number):2003029777
Application date: Jul. 16, 2001
Publication date: Jan. 31, 2003
Summary:
【要約】【課題】音声認識に基づく言語を文字列及び制御情報等として使い分けることが可能な音声処理装置を提供する。【解決手段】CCDカメラ1により話者が撮像されていないときには、制御部2により第1変換モードを設定し、マイクロホン4から音声を入力し、この音声によって示される言語を音声認識部5により認識して、この言語に対応する制御情報をコマンド変換部75により検索し、またCCDカメラ1により話者が撮像されたときには、第2変換モードを設定し、音声によって示される言語を認識して、この言語に対応する文字列を文字変換部70により検索しているので、音声認識に基づく言語を文字列及び制御情報等として使い分けることができる。
Claim (excerpt):
音声を入力する音声入力手段と、入力された音声を認識して、この音声によって表される言語を出力する音声認識手段と、音声認識手段の作動を入力指示する入力指示手段と、話者を撮像するための撮像手段と、撮像された画像に基づいて、話者を認識する画像認識手段と、指示入力手段によって音声認識手段の作動が指示されたときには、画像認識手段による認識結果に基づいて、予め設定された第1及び第2モードのいずれかを選択し、この選択したモードで音声認識された言語を用いる制御手段とを備えることを特徴とする音声処理装置。
IPC (6):
G10L 15/00 ,  G06F 3/16 320 ,  G06T 1/00 340 ,  G10L 15/22 ,  G10L 15/24 ,  G10L 15/28
FI (7):
G06F 3/16 320 H ,  G06T 1/00 340 A ,  G10L 3/00 551 P ,  G10L 3/00 561 C ,  G10L 3/00 571 Q ,  G10L 3/00 571 J ,  G10L 3/00 571 K
F-Term (10):
5B057BA02 ,  5B057CA12 ,  5B057CA16 ,  5B057CB12 ,  5B057CB16 ,  5B057DA06 ,  5D015KK01 ,  5D015KK02 ,  5D015LL05 ,  5D015LL07
Patent cited by the Patent:
Cited by examiner (3)

Return to Previous Page