特許
J-GLOBAL ID:200903052882088028

対話エージェント

発明者:
出願人/特許権者:
代理人 (2件): 西川 惠清 ,  森 厚夫
公報種別:公開公報
出願番号(国際出願番号):特願2004-254794
公開番号(公開出願番号):特開2006-071936
出願日: 2004年09月01日
公開日(公表日): 2006年03月16日
要約:
【課題】利用者への応答を自我状態に応じて変化させ、利用者に違和感や不快感の生じない自然な対話を行うことを可能とした対話エージェントを提供する。【解決手段】顔感情推定部13はカメラ41で撮像した利用者の表情から感情を推定する。マイクロホン42から入力された利用者の音声は、音声感情推定部14で感情が推定され、口調推定部15で口調が推定され、テキスト抽出部16でテキストが抽出される。自我状態推定部20では、利用者の表情から得た感情と音声から得た感情と口調とテキストとの4種類の情報を組み合わせることにより利用者の発話に対する自我状態ベクトルを推定する。対話制御部30は、利用者の発話により推定された自我状態ベクトルから応答用の自我状態ベクトルおよびテキストを決定し、スピーカ43を通して合成音声で応答する。【選択図】 図1
請求項(抜粋):
利用者の音声が入力される音声入力手段と、音声入力手段から入力された音声の内容に応答するテキストを生成する対話処理手段と、対話処理手段により生成されたテキストを利用者に対して出力するテキスト出力手段とを有し、対話処理手段は、音声入力手段から入力された音声の韻律的特徴を用いて利用者の感情を複数種類に分類し音声感情データとして出力する音声感情推定部と、音声入力手段から入力された音声の韻律的特徴を用いて利用者の口調を複数種類に分類し口調データとして出力する口調推定部と、音声入力手段から入力された音声から音列を抽出しテキストデータとして出力するテキスト抽出部と、利用者の顔を撮像する画像入力手段と、画像入力手段により撮像した利用者の顔の各部位に設定した特徴点の時間経過に伴う位置の変化から表情を分類する表情推定部と、表情推定部で抽出された表情が入力され時間変化に伴う表情の変化パターンを用いて利用者の感情を複数種類に分類し感情サマリデータとして出力する顔感情推定部と、対話する両者の心のモデルである自我状態の組合せを話し手から聞き手への向きも含めた自我状態ベクトルとし感情サマリデータと音声感情データと口調データとテキストデータとの組から利用者の発話による自我状態ベクトルを推定する自我状態推定部と、自我状態推定部で推定された自我状態ベクトルからあらかじめ設定されている対応ルールに従って利用者に応答する際の自我状態ベクトルを決定しかつテキストデータの内容から利用者に応答するテキストを自動的に決定する対話制御部とを備えることを特徴とする対話エージェント。
IPC (7件):
G10L 15/22 ,  G06F 17/28 ,  G06T 7/20 ,  G10L 13/00 ,  G10L 13/08 ,  G10L 15/10 ,  G10L 17/00
FI (7件):
G10L3/00 571U ,  G06F17/28 X ,  G06T7/20 300B ,  G10L3/00 R ,  G10L3/00 H ,  G10L3/00 531N ,  G10L3/00 545F
Fターム (23件):
5B091AA15 ,  5B091CA14 ,  5B091CB12 ,  5B091CB32 ,  5B091EA01 ,  5B091EA02 ,  5D015AA03 ,  5D015AA06 ,  5D045AA09 ,  5L096BA08 ,  5L096BA18 ,  5L096CA02 ,  5L096CA04 ,  5L096CA27 ,  5L096EA39 ,  5L096FA09 ,  5L096FA35 ,  5L096FA39 ,  5L096FA69 ,  5L096HA02 ,  5L096HA07 ,  5L096HA09 ,  5L096JA11
引用特許:
出願人引用 (1件)

前のページに戻る