特許
J-GLOBAL ID:201103011730629295
音声対話装置
発明者:
,
,
出願人/特許権者:
代理人 (7件):
曾我 道照
, 曾我 道治
, 池谷 豊
, 古川 秀利
, 鈴木 憲七
, 長谷 正久
, 福井 宏司
公報種別:特許公報
出願番号(国際出願番号):特願平11-101628
公開番号(公開出願番号):特開2000-293194
特許番号:特許第3933813号
出願日: 1999年04月08日
公開日(公表日): 2000年10月20日
請求項(抜粋):
【請求項1】 入力音声に対して認識処理を行い音声認識結果を出力する音声認識部と、
各対話状態における、音声認識対象語彙と、音声認識結果及び誤認識回数に応じた遷移先対話状態と、応答文を規定した対話手順を保持する対話手順記憶部と、
利用者との対話が開始されて現在の対話状態に至るまでの音声認識の正解認識回数及び誤認識回数を保持する音声認識正誤回数記憶部と、
前記音声認識正誤回数記憶部に保持された音声認識の正誤回数と前記音声認識部が出力する音声認識結果に基づいて、前記対話手順記憶部に保持された対話手順を参照して遷移先対話状態を決定して出力する遷移先対話状態決定部と、
前記音声認識部が出力する音声認識結果に対する正誤結果を出力し、前記遷移先対話状態決定部が出力する遷移先対話状態へ対話状態を遷移する対話管理部とを備え、
前記対話管理部は、第1の対話状態に到達すると、前記対話手順記憶部に保持された前記第1の対話状態に対する対話手順を参照して、利用者に対して応答文として第1の音声認識対象語彙を入力するよう応答し、
前記遷移先対話状態決定部は、前記対話手順記憶部に保持された第1の対話状態での遷移先対話状態を参照して、前記音声認識部が出力する入力音声と同じ第1の認識結果と、前記音声認識正誤回数記憶部に保持された誤認識回数から、遷移先対話状態として第2の対話状態を決定して出力し、
前記対話管理部は、前記遷移先対話状態決定部が出力する前記第2の対話状態へ現在の対話状態を遷移させ、前記対話手順記憶部に保持された第2の対話状態での対話手順を参照して、利用者に対して応答文として前記第1の認識結果かどうかを確認するよう応答し、前記音声認識部の確認応答に対する肯定の第2の認識結果に基づき、前記第1の認識結果は正しい認識結果と判断し、この正解認識に基づき前記音声認識正誤回数記憶部に保持されている正解認識回数を更新し、
前記遷移先対話状態決定部は、前記対話手順記憶部に保持された第2の対話状態での遷移先対話状態を参照して、前記音声認識部が出力する第2の認識結果と、前記音声認識正誤回数記憶部に保持された誤認識回数から、前記誤認識回数が所定数以下の場合には、遷移先対話状態として第3の対話状態を決定して出力し、前記誤認識回数が所定数より大きい場合には、遷移先対話状態として第4の対話状態を決定して出力し、
前記対話管理部は、前記第3の対話状態へ現在の対話状態を遷移させ、前記対話手順記憶部に保持された第3の対話状態での対話手順を参照して、利用者に対して応答文として前記第1の音声認識対象語彙より下位概念である第2の音声認識対象語彙及び前記第2の音声認識対象語彙より下位概念である第3の音声認識対象語彙を入力するよう応答し、前記第4の対話状態へ現在の対話状態を遷移させ、前記対話手順記憶部に保持された第4の対話状態での対話手順を参照して、利用者に対して応答文として前記第1の音声認識対象語彙より下位概念である第2の音声認識対象語彙を入力するよう応答し、
前記遷移先対話状態決定部は、前記対話手順記憶部に保持された第1の対話状態での遷移先対話状態を参照して、前記音声認識部が出力する入力音声と異なる第3の認識結果と、前記音声認識正誤回数記憶部に保持された誤認識回数から、遷移先対話状態として第5の対話状態を決定して出力し、
前記対話管理部は、前記第5の対話状態へ現在の対話状態を遷移させ、前記対話手順記憶部に保持された第5の対話状態での対話手順を参照して、利用者に対して応答文として前記第3の認識結果かどうかを確認するよう応答し、
前記対話管理部は、前記音声認識部の確認応答に対する否定の第4の認識結果に基づき、前記第3の認識結果は誤った認識結果と判断し、この誤認識に基づき前記音声認識正誤回数記憶部に保持されている誤認識回数を更新する
ことを特徴とする音声対話装置。
IPC (5件):
G10L 15/22 ( 200 6.01)
, G10L 15/00 ( 200 6.01)
, G10L 15/28 ( 200 6.01)
, G10L 15/06 ( 200 6.01)
, G06F 17/28 ( 200 6.01)
FI (7件):
G10L 15/22 200 V
, G10L 15/22 300 U
, G10L 15/22 460 D
, G10L 15/00 200 A
, G10L 15/28 230 K
, G10L 15/06 400 W
, G06F 17/28 V
引用特許:
出願人引用 (5件)
-
特開昭62-039899
-
音声入力方法およびこの方法を実施する装置
公報種別:公開公報
出願番号:特願平7-141917
出願人:日本電信電話株式会社
-
特開平3-088466
-
音声対話手順生成装置
公報種別:公開公報
出願番号:特願平8-244613
出願人:日本電信電話株式会社
-
対話制御装置
公報種別:公開公報
出願番号:特願平7-271065
出願人:エヌ・ティ・ティ・データ通信株式会社
全件表示
審査官引用 (5件)
-
特開昭62-039899
-
音声入力方法およびこの方法を実施する装置
公報種別:公開公報
出願番号:特願平7-141917
出願人:日本電信電話株式会社
-
特開平3-088466
-
音声対話手順生成装置
公報種別:公開公報
出願番号:特願平8-244613
出願人:日本電信電話株式会社
-
対話制御装置
公報種別:公開公報
出願番号:特願平7-271065
出願人:エヌ・ティ・ティ・データ通信株式会社
全件表示
引用文献:
前のページに戻る