特許
J-GLOBAL ID:200903063560676570

音声認識装置

発明者:
出願人/特許権者:
公報種別:公開公報
出願番号(国際出願番号):特願平4-219296
公開番号(公開出願番号):特開平6-067686
出願日: 1992年08月18日
公開日(公表日): 1994年03月11日
要約:
【要約】【目的】 本発明は、話者に対して少ない負担で比較的高い認識精度を得ることができる音声認識装置を提供すること。【構成】 本発明の音声認識装置におけるCPUは、A/D変換装置により標本化され、RAMに格納されている音声信号データに対し、一定時間間隔毎に線形予測(LPC)分析によりLPCケプストラム係数を算出する(S41)。次に、CPUは前記ケプストラム係数に対しベクトル量子化処理を行い、シンボル時系列を出力する(S42)。次に、CPUは利用する話者の発声した学習用音声データより学習されている出現頻度の高い第一のグループの音素HMMと、予め不特定多数の話者が発声した音声データより学習されている出現頻度の低い第2のグループの音素HMMとを使用し、入力されたシンボル時系列を認識する(S43)。
請求項(抜粋):
音素やそれに類する識別単位の音声モデルにより連続音声を認識する音声認識装置において、前記識別単位を出現頻度により2つのグループに分け、出現頻度の高いグループに対して、利用話者の発声した学習用音声データにより音声モデルを学習する学習手段と、その学習手段により学習された音声モデルを格納する第1の音声辞書と、不特定多数の話者が発声した音声データにより予め学習されている、出現頻度の低いグループに対する音声モデルを格納する第2の音声辞書と、前記第1および第2の音声辞書を参照して、入力された音声を認識する認識手段とを備えたことを特徴とする音声認識装置。
IPC (3件):
G10L 3/00 535 ,  G10L 3/00 521 ,  G10L 3/00
引用特許:
審査官引用 (12件)
  • 特開昭63-063098
  • 特開平1-097999
  • 特開昭64-004798
全件表示

前のページに戻る