特許
J-GLOBAL ID:200903088481084075

不特定話者音声認識装置およびその方法

発明者:
出願人/特許権者:
代理人 (1件): 志賀 富士弥 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平6-159062
公開番号(公開出願番号):特開平7-306691
出願日: 1994年07月12日
公開日(公表日): 1995年11月21日
要約:
【要約】【目的】 単語の発声を正確に認識できるようにした。【構成】 不特定話者の発声がマイクロフォン1を通じて電気信号に変換される。その電気信号はアンプ2で増幅され、A/D変換器3でデジタル信号変換される。その信号は窓関数機能発生器4、FTアナライザ5、パワースペクトル6を介して音素認識部7に入力される。音素認識部7では入力された信号を時系列の多次元離散特徴ベクトルに変換する。その特徴ベクトルは複数の候補に変換され、これによりその複数の音素が複数の候補として時系列において複数の音素列を構成する。複数の音素候補は、辞書8に記憶された各単語に対する各標準音素列の標準パターンと単語認識部9で比較判断される。この判断の結果として各単語から少なくとも1個の候補を音声認識の結果として認識単語出力部11から出力する。
請求項(抜粋):
(a)不特定話者による発声を電気信号に入力するための音声入力部と、(b)上記音声入力部から上記電気信号を受信し、上記電気信号を時系列の多次元離散特徴ベクトルに変換するための特徴抽出部と、(c)上記時系列の多次元離散特徴ベクトルを受け取り、上記各ベクトルを第1位から第n位(nは任意の数を示す)に至る複数の音素の候補に変換する音素認識部と、(d)上記音素認識部から時系列の音素候補列を受け取り、予め辞書に収められた認識させたい全ての単語に対する各標準音素列と比較し、上記音素認識部より得られた音素候補列に最も類似している単語を選ぶ単語認識部と、(e)上記単語認識部により、上記辞書に記憶された各単語の標準音素列と音素認識部で得られた音素候補列との類似度を求めることによって実行された単語認識の結果として少なくとも1個の単語候補を出力するための認識単語出力部とを具備する不特定話者音声認識装置。
IPC (3件):
G10L 3/00 531 ,  G10L 3/00 ,  G10L 9/10 301
引用特許:
審査官引用 (2件)
  • 特開平2-061700
  • 特開平1-204099

前のページに戻る