特許
J-GLOBAL ID:200903063463098279

音声認識装置

発明者:
出願人/特許権者:
公報種別:公開公報
出願番号(国際出願番号):特願平11-238813
公開番号(公開出願番号):特開2001-067091
出願日: 1999年08月25日
公開日(公表日): 2001年03月16日
要約:
【要約】【課題】 音声認識を行う発話区間の特定方法としてキーワード方式、トリガ方式、PTT方式のうち少なくとも2方式を兼用して利便性を向上する。【解決手段】 音声認識動作が開始されると、キーワードが発話されたか、トークボタン1が操作されたかを判定する。ここで、キーワードが発話された場合には、キーワード方式の音声認識処理に分岐し、音声区間検出部7による発話区間の開始点の推定と、発話区間の終了点の推定を行う。また、トークボタン1が操作された場合には、その時点で発話区間の開始点を特定する。そして、その操作が瞬間的なものか否かを判断し、瞬間的なものであれば、トリガ方式の音声認識処理に分岐し、音声区間検出部7による発話区間の終了点の推定を行う。また、トークボタン1の操作が継続的なものであれば、PTT方式の音声認識処理に分岐し、トークボタン1の操作解除時点で発話区間の終了点を特定する。
請求項(抜粋):
音声入力手段によって入力された音声を認識して文字列情報に変換する音声認識装置において、前記音声入力手段によって入力された音声を認識する音声認識手段と、ユーザが発話区間を特定するための入力操作を行うための操作手段と、前記音声入力手段から入力される音声に対して音声認識を行うための発話区間を特定することにより、この発話区間における入力音声を前記音声認識手段によって音声認識し、その音声認識結果を出力する音声認識制御手段とを有し、前記音声認識制御手段は、前記音声入力手段によって入力されたキーワードを前記音声認識手段によって認識することにより、そのキーワード入力に続く発話区間の開始点と終了点の推定処理を行うキーワード方式と、前記操作手段の瞬間的操作によって発話区間の開始点を特定するとともに、その発話区間の終了点の推定処理を行うトリガ方式と、前記操作手段の連続的操作及び操作解除によって発話区間の開始点と終了点とを特定するPTT方式の3方式のうち少なくとも2方式を組み合わせることにより、発話区間を特定するようにした、ことを特徴とする音声認識装置。
IPC (3件):
G10L 11/02 ,  G10L 15/04 ,  G10L 15/28
FI (3件):
G10L 3/00 513 C ,  G10L 3/00 511 ,  G10L 3/00 571 K
Fターム (6件):
5D015AA04 ,  5D015DD01 ,  5D015DD03 ,  5D015DD04 ,  5D015LL08 ,  5D015LL10

前のページに戻る