特許
J-GLOBAL ID:200903065335002075

音声認識装置および方法

発明者:
出願人/特許権者:
代理人 (1件): 外川 英明
公報種別:公開公報
出願番号(国際出願番号):特願平11-255076
公開番号(公開出願番号):特開2001-083990
出願日: 1999年09月09日
公開日(公表日): 2001年03月30日
要約:
【要約】【課題】 直前の入力文が認識され画面に表示されてから次の発声を開始する時間間隔や、直前の発生信号と現在の入力信号を比較することで、再入力か次入力かを判断し、再入力位置を指示する手間を減少させることができる音声認識装置及び方法を提供することを目的とする。【解決手段】 入力された音声信号を文字コードに変換する音声認識方法において、直前に入力された文字列が認識され画面上に表示されたから、次の入力の発声開始までの時間を計測し、予め定められたある時間に満たずに発声が開始された場合には新しい認識結果と直前の認識結果と置き換え、ある時間を超過して発声された場合には直前の認識結果の後方に新たな認識結果を追加することを特徴とする。
請求項(抜粋):
入力された音声を電気的な音声信号に変換する入力手段と、この入力手段によって変換された前記音声信号を認識するため一時的に格納する認識バッファと、前記認識バッファに格納された前記音声信号を文字コードに変換する音響認識手段と、前記音響認識手段によって変換された前記文字コードを格納する文章バッファと、前記文章バッファに格納された前記文字コードを画面上に文字列として表示する表示手段とを有する音声認識装置において、前記表示手段によって前記文字列が画面上に表示されてから次の入力となる音声までの時間間隔を測定するとともに、この時間間隔に応じて認識誤りを正すための再入力であるのか、あるいは前記文字列の次の入力であるのかを判定する再入力時間判定手段と、前記再入力時間判定手段により前記再入力と判定された場合、前記文章バッファ中に格納されている直前に入力された第1の文字コードと新たな入力音声に対応する第2の文字コードとを置換し、次の入力であると判断された場合、前記文章バッファ中の最後尾あるいはカーソルが示す位置に前記第2の文字コードを格納する文章処理手段とを具備したことを特徴とする音声認識装置。
IPC (2件):
G10L 15/22 ,  G06F 3/16 340
FI (2件):
G10L 3/00 561 E ,  G06F 3/16 340 C
Fターム (1件):
5D015LL04
引用特許:
審査官引用 (6件)
  • 音声認識装置
    公報種別:公開公報   出願番号:特願平7-001692   出願人:ソニー株式会社
  • 特開平3-148750
  • 特開平3-148750
全件表示

前のページに戻る