特許
J-GLOBAL ID:200903093753441607
連続音声認識装置
発明者:
,
,
出願人/特許権者:
代理人 (1件):
青山 葆 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平8-246012
公開番号(公開出願番号):特開平10-091185
出願日: 1996年09月18日
公開日(公表日): 1998年04月10日
要約:
【要約】【課題】 狭いビーム幅で単語仮説の絞り込みを行うことができ、より小さい計算コストで自然発話の連続音声認識を行うことができる連続音声認識装置を提供する。【解決手段】 単語照合部4は、例えばワン-パス・ビタビ復号化法を用いて、入力される発声音声文の音声信号の特徴パラメータに基づいて上記発声音声文の単語仮説を検出し音響尤度を計算して出力する。尤度補正部7は、単語照合部4からの単語仮説に対して、当該単語の各音素の時間方向の中央部の音響尤度を、当該中央部よりも遅延された時刻に移動するように遅延させて、当該単語仮説の音響尤度を補正する。単語仮説絞込部6は、尤度補正部7からの、音響尤度を含む総合尤度を有する単語仮説に基づいて、当該単語の先頭音素環境毎に、発声開始時刻から当該単語の終了時刻に至る計算された総合尤度のうちの最も高い尤度を有する1つの単語仮説で代表させるように単語仮説の絞り込みを行う。
請求項(抜粋):
入力される発声音声文の音声信号に基づいて上記発声音声文の単語仮説を検出し音響尤度を計算することにより、連続的に音声認識する音声認識手段を備えた連続音声認識装置において、上記音声認識手段は、単語の各音素の時間方向の中央部の音響尤度を、当該中央部よりも遅延された時刻に移動するように遅延させて、単語仮説の音響尤度を補正することを特徴とする音声認識装置。
IPC (3件):
G10L 3/00 531
, G10L 3/00
, G10L 3/00 533
FI (3件):
G10L 3/00 531 D
, G10L 3/00 531 E
, G10L 3/00 533 D
前のページに戻る