特許
J-GLOBAL ID:200903043812144827

音声認識方法及び装置、音声対話システム、記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 鈴木 正剛
公報種別:公開公報
出願番号(国際出願番号):特願平10-246624
公開番号(公開出願番号):特開2000-075894
出願日: 1998年09月01日
公開日(公表日): 2000年03月14日
要約:
【要約】【課題】 認識対象の音響的特徴が酷似し、単語出現頻度もほぼ同一である場合であっても高精度な認識結果が得られる音声認識装置を提供する。【解決手段】 第1感性情報処理部12では、韻律的感性モデル121から入力音声データの韻律特徴に対応する感情価Qk が選び出す。音声認識部13では、音響モデル131及び言語モデル132を利用して、入力音声データの音声認識を行い、候補の単語のスコアSwnを導き、Swnが最も高い単語候補Wn としてN個を選び出す。第2感性情報処理部14では、意味的感性モデル141を用いてN個の単語候補Wn それぞれの感情価Rwnを求める。感性状態統合部15では、N個の単語候補Wn について、感情価Qk 、Rwnを用いて単語候補スコアSwnを重み付けすることで認識スコアTwnを算出する。認識結果出力部16は認識スコアTwnが最も高い単語候補Wn を認識結果として出力する。
請求項(抜粋):
入力音声データから韻律情報を抽出して発話者の感性状態を推定する過程と、音声認識処理により候補として挙げられた単語候補の中から前記推定された感性状態に矛盾した認識結果を特定する過程と、特定した認識結果を抑圧する過程とを含む音声認識方法。
IPC (4件):
G10L 15/28 ,  G06F 3/16 320 ,  G10L 11/00 ,  G10L 15/08
FI (4件):
G10L 3/00 561 Z ,  G06F 3/16 320 H ,  G10L 9/00 A ,  G10L 9/00 301 C
Fターム (4件):
5D015FF03 ,  5D015HH23 ,  5D015JJ00 ,  5D015LL02

前のページに戻る