特許
J-GLOBAL ID:200903056170174616

対話音声認識装置

発明者:
出願人/特許権者:
代理人 (1件): 深見 久郎 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平5-002103
公開番号(公開出願番号):特開平6-208388
出願日: 1993年01月08日
公開日(公表日): 1994年07月26日
要約:
【要約】【目的】 人手により記述された対話構造や領域に関する知識を用いることなく、話者の交替と発話行為タイプの系列に関する統計的な情報から作成した対話モデルを用いて次発話の発話行為タイプを予測することにより、文脈的に最も尤もらしい音声認識候補を求めることを目的とする。【構成】 文音声認識装置1が出力する複数の文候補について、構文解析装置2および発話行為タイプ解釈装置3を用いてその文候補の発話行為タイプを解釈し、現在の発話に至るまでの話者の交替および発話行為タイプの系列の履歴と、対話モデル学習装置10が作成した対話モデルを用いて、文脈的に最も尤もらしい文音声認識候補を求め、文候補選択装置4から文候補を出力する。
請求項(抜粋):
音声言語でなされる対話を認識する音声認識装置であって、言語の構造に関する文法記述を用いて、前記音声認識装置が出力する文を、その構造の記述に変換する構文解析手段と、前記構文解析手段が出力する文の構造記述を入力とし、話し手から聞き手への働きかけ方の観点からの文の意味的効果を分類する発話行為タイプ解釈手段と、対話における話者の交替および発話行為タイプの系列に関する統計的な情報に基づいて、対話モデルを作成する対話モデル学習手段と、現在の発話に至るまでの話者の交替および発話行為タイプの系列の履歴と、前記対話モデル学習手段が生成した対話モデルを用いて、前記音声認識装置が出力する複数の文候補の中から、文脈的に最も尤もらしい文音声認識候補を選択する文候補選択手段とを備え、前記音声認識装置が出力する複数の文候補について、前記構文解析手段および前記発話行為タイプ解釈手段を用いて、その文候補の発話行為タイプを解釈し、現在の発話に至るまでの話者の交替および発話行為タイプの系列の履歴と、前記対話モデル学習手段が作成した対話モデルを用いて、文脈的に最も尤もらしい音声認識候補を求めることを特徴とする、対話音声認識装置。
IPC (3件):
G10L 3/00 531 ,  G10L 3/00 ,  G10L 3/00 561
引用特許:
審査官引用 (1件)
  • 特開平4-307664

前のページに戻る