文献
J-GLOBAL ID:202002218503193744   整理番号:20A0116757

Bi-Directional LSTM Networkを用いた発話に伴うジェスチャの自動生成手法

Speech-to-Gesture Generation Using Bi-Directional LSTM Network
著者 (6件):
資料名:
巻: 34  号:ページ: C-J41_1-12(J-STAGE)  発行年: 2019年 
JST資料番号: U0128A  ISSN: 1346-8030  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
自動的な発話ドリブンの自然なジェスチャモーションの生成のための新しいフレームワークを提案した。提案した方法は2段階からなる。第1に,Bi-Directional LSTM Networkに基づき,本深層ネットワークは長期間に渡って前後の両方の一貫性を有する発話-ジェスチャ関係を学習した。本ネットワークは各時間ステップで入力音声から抽出された知覚特徴量から,人間の完全な3D骨格姿勢を回帰した。第2に,組み合わせた時系列フィルタを適用し,生成した姿勢列をスムージングした。本ネットワークを訓練するために,ヘッドセットとマーカーに基づくモーションキャプチャによって記録された発話-ジェスチャデータセットを利用した。提案した手法の有効性を検証するために,異なる音響的特徴,ネットワーク構造,及び時系列フィルタを評価した。また,主観的評価を行い,実際の人間のジェスチャと本アプローチを比較した。主観的評価結果は生成されたジェスチャが自然さの尺度において“オリジナルの”人間のジェスチャに匹敵し,異なる発話から得られた“不整合な”人間のジェスチャよりも有意に優れていることを示した。(翻訳著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
図形・画像処理一般  ,  自然語処理 
引用文献 (28件):
  • [Alku 02] Alku, P., Bäckström, T., and Vilkman, E.: Normalized amplitude quotient for parametrization of the glottal flow, The Journal of the Acoustical Society of America, Vol. 112, No. 2, pp. 701-710 (2002)
  • [André 10] André, E. and Pelachaud, C.: Interacting with embodied conversational agents, in Speech Technology: Theory and Applications, pp. 123-149, Springer (2010)
  • [Bickmore 10] Bickmore, T. W., Pfeifer, L. M., Byron, D., Forsythe, S., Henault, L. E., Jack, B. W., Silliman, R., and Paasche-Orlow, M. K.: Usability of conversational agents by patients with inadequate health literacy: Evidence from two clinical trials, Journal of Health Communication, Vol. 15, No. S2, pp. 197-210 (2010)
  • [Boersma 01] Boersma, P.: Praat, a system for doing phonetics by computer, Glot International, Vol. 5, No. 9/10, pp. 341-345 (2001)
  • [Breazeal 05] Breazeal, C., Kidd, C. D., Thomaz, A. L., Hoffman, G., and Berlin, M.: Effects of nonverbal communication on efficiency and robustness in human-robot teamwork, in Proceedings of the IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS), pp. 708-713 (2005)
もっと見る
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る