特許
J-GLOBAL ID:200903018892246906

音声認識装置

発明者:
出願人/特許権者:
公報種別:公開公報
出願番号(国際出願番号):特願平8-027428
公開番号(公開出願番号):特開平9-050292
出願日: 1996年01月23日
公開日(公表日): 1997年02月18日
要約:
【要約】【課題】辞書作成時における発声長と音声入力時の発声長に変動がある場合、正確な音声認識ができなくなる。【解決手段】1フレ-ム毎の入力音声信号と音声標準パタ-ンの類似度を辞書照合部4で求め、類似度がしきい値αを超えたときに認識結果候補とする。入力信号中の音声区間内で各認識結果候補のフレ-ムが他の認識結果候補のフレ-ムと重なり合っているかを認識結果選択部7で判断し、フレ-ムが重なり合っていない認識結果候補はそのまま認識結果として出力する。認識結果候補のフレ-ムが他の認識結果候補のフレ-ムと重なり合っている場合は最も長いフレ-ム長の認識結果候補を認識結果の第一位とする。
請求項(抜粋):
音声入力手段と特徴抽出手段と辞書照合手段と認識候補保存手段と音声区間検出手段と認識結果選択手段及び認識結果出力手段を有し、音声入力手段は音声を入力し、特徴抽出手段は入力した音声信号を1フレ-ム毎の特徴ベクトル時系列に変換し、辞書照合手段は1フレ-ム毎の特徴ベクトルとあらかじめ登録された音声標準パタ-ンの類似度を求め、類似度があらかじめ定めたしきい値αを超えたときに認識結果候補として出力し、認識候補保存手段は辞書照合手段から出力する認識結果候補と各認識結果候補毎の類似度及び各認識結果候補毎の終端位置とフレ-ム長を示すフレ-ム情報を記憶し、音声区間検出手段は入力信号中の音声区間の始端および終端を検出し、認識結果選択手段はフレ-ム重なり判定手段とフレ-ム長比較手段及び類似度判定手段を有し、フレ-ム重なり判定手段は音声区間検出手段で検出した同一音声区間内で各認識結果候補のフレ-ムが他の認識結果候補のフレ-ムと重なり合っているかどうかを判断し、他の認識結果候補のフレ-ムと重なり合っていない認識結果候補を認識結果出力手段に送り、他の認識結果候補のフレ-ムと重なり合っている認識結果候補をフレ-ム長比較手段に送り、フレ-ム長比較手段はフレ-ム重なり判定手段でフレ-ムが重なり合ったと判断された認識結果候補の各フレ-ム長を比較し、互いに重なり合った認識結果候補のフレ-ム長が異なるときは最も長いフレ-ム長の認識結果候補を認識結果出力手段に送り、フレ-ム長に差がない互いに重なり合った認識結果候補を類似度判定手段に送り、類似度判定手段は送られた認識結果候補の類似度を比較し、フレ-ム長に差がない認識結果候補の中から類似度が最大値を示す認識結果候補を選択して認識結果出力手段に送り、認識結果出力手段は送られた認識結果候補を認識結果として出力することを特徴とする音声認識装置。
引用特許:
審査官引用 (5件)
  • 音声認識装置
    公報種別:公開公報   出願番号:特願平5-200919   出願人:ソニー株式会社
  • 特開昭59-172693
  • 特開平4-362699
全件表示

前のページに戻る