特許
J-GLOBAL ID:200903024723077054

音声対話処理装置

発明者:
出願人/特許権者:
代理人 (1件): 志賀 正武
公報種別:公開公報
出願番号(国際出願番号):特願平4-265196
公開番号(公開出願番号):特開平6-118988
出願日: 1992年10月02日
公開日(公表日): 1994年04月28日
要約:
【要約】【目的】 最初の音声入力ならびに音声再入力時において、より精度の高い認識結果を得るとともに、音声認識に関する処理時間の削減が図れ、さらに、不要な区間を認識対象としないことにより湧き出しを減少する。【構成】 最初の音声入力時には、第1の尤度計算部11aによって、分析フレームごとの特徴パラメータの参照を音声信号の後方から前方に向けて行なう。一方、処理誤り後の第2回目の音声入力の場合には、再入力時においてはキーワードは発声文の始端付近に存在するという傾向を反映して、第2の尤度計算部11bによって、最初の音声入力時と同様の処理を、音声信号の前方から後方に向けて行なう。
請求項(抜粋):
入力されたアナログ音声信号をディジタル音声信号に変換するAD変換部と、ディジタル音声信号を分析し特徴パラメータを抽出する音声分析部と、前記音声分析部において抽出された特徴パラメータをベクトル量子化するためのコードブックを蓄積したベクトル量子化コードブック蓄積部と、ベクトル量子化された特徴パラメータを認識対象単語ごとに予め蓄積している学習データ蓄積部と、入力音声の任意の部分的音声区間を前記学習データ蓄積部に蓄積された認識対象単語と比較することにより認識対象単語の尤度計算部と、入力音声の発話内容決定、対話の進行状況の管理ならびに出力合成音声の発話内容の決定を行なう対話処理制御部と、前記対話処理制御部において決定された発話内容に基づいて合成音声の生成・出力を行なう音声出力部とから構成されることを特徴とする音声対話処理装置において、前記尤度計算部は、第1回目の音声入力の場合には認識対象単語の尤度数計算を入力音声信号の後方から前方に向けて処理する第1の尤度計算部と、処理誤り後の第2回目の音声入力の場合には尤度計算を入力音声信号の前方から後方に向けて処理する第2の尤度計算部とから構成されることを特徴とする音声対話処理装置。
IPC (3件):
G10L 3/00 531 ,  G10L 3/00 571 ,  G10L 3/00

前のページに戻る