特許
J-GLOBAL ID:200903013077248862

対話システムのための音声認識システム

発明者:
出願人/特許権者:
代理人 (1件): 青山 葆 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平10-072019
公開番号(公開出願番号):特開平11-272292
出願日: 1998年03月20日
公開日(公表日): 1999年10月08日
要約:
【要約】【課題】 対話システムのための音声認識装置においてプラン知識を用いずにより高い音声認識率で音声認識することができる音声認識システムを提供する。【解決手段】 予測テーブル作成部23は、所定の対話データから、内容語、プレターミナル、文末表現、及び発話タイプに関する統計情報を含む予測テーブルを作成して予測テーブルメモリ32に記憶する。確率再計算部21は、所定の発話状況データを前提として、予測テーブルメモリ23に記憶された予測テーブルを参照して、既存の音声認識装置10から出力される第1の音声認識結果に対して、それらの音声認識候補の出現確率を再計算する。並べ換え処理部22は、再計算された音声認識候補の出現確率に基づいて、音声認識候補の出現確率の高い順に並べ換えて第2の音声認識結果として出力する。
請求項(抜粋):
入力される発声音声を音声信号に変換した後、所定の音響モデル及び言語モデルを参照して音声認識して、音声認識された第1の音声認識結果を出力する第1の音声認識装置と、上記第1の音声認識装置から出力される第1の音声認識結果に対して、対話システムの発話状況を参照して音声再認識処理を実行して第2の音声認識結果を出力する第2の音声認識装置とを備えた対話システムのための音声認識システムであって、上記第2の音声認識装置は、対話の話者役割と、質問や要求及びそれらに対する応答を含む発話の機能を表す発話タイプと、単語列及び単語列中の各単語に対する品詞を含むプレターミナルを含む形態素列と、発話の文末表現とを備えた発話毎の対話データを記憶する第1の記憶装置と、上記第1の記憶装置に記憶された対話データから、内容語、プレターミナル、文末表現、及び発話タイプに関する統計情報を含む予測テーブルを作成する作成手段と、上記作成手段によって作成された予測テーブルを記憶する第2の記憶装置と、前回の発話における話者役割と、内容語と、文末表現とを含む発話状況データを記憶する第3の記憶装置と、上記第3の記憶装置に記憶された発話状況データを前提として、上記第2の記憶装置に記憶された予測テーブルを参照して、上記第1の音声認識装置から出力される第1の音声認識結果に対して、それらの音声認識候補の出現確率を再計算する計算手段と、上記計算手段によって再計算された音声認識候補の出現確率に基づいて、音声認識候補の出現確率の高い順に並べ換えて第2の音声認識結果として出力する処理手段とを備えたことを特徴とする対話システムのための音声認識システム。
IPC (6件):
G10L 3/00 561 ,  G10L 3/00 571 ,  G06F 3/16 340 ,  G06F 17/27 ,  G06F 17/28 ,  G06F 17/30
FI (6件):
G10L 3/00 561 G ,  G10L 3/00 571 H ,  G06F 3/16 340 F ,  G06F 15/38 N ,  G06F 15/38 V ,  G06F 15/40 370 E

前のページに戻る