視聴覚データのCNNベース特徴を用いた感情次元の推定【JST・京大機械翻訳】

Basnet Ramesh; Islam Mohammad Tariqul; Howlader Tamanna; Rahman S. M. Mahbubur; Hatzinakos Dimitrios

文献

J-GLOBAL ID：201902244492201427 整理番号：19A2855511

視聴覚データのCNNベース特徴を用いた感情次元の推定【JST・京大機械翻訳】

Estimation of affective dimensions using CNN-based features of audiovisual data

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=19A2855511&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=19A2855511&from=J-GLOBAL&jstjournalNo=H0913A") }}

著者 (5件)： , , , ,
資料名：
巻： 128 ページ： 290-297 発行年： 2019年
JST資料番号： H0913A ISSN： 0167-8655 資料種別：逐次刊行物 (A)
記事区分：原著論文発行国：オランダ (NLD) 言語：英語 (EN)

感情状態の自動推定は,感情がユーザ指向対話技術における重要な要素であるので,大きな関心事である。本論文は,連続レベルの感情状態の次元を予測するために,フィードフォワード畳込みニューラルネットワーク(CNN)の使用とそのようなネットワークから抽出された特徴を調査する。この文脈において,ビデオと音声データを同時に学習する2ストリームCNNアーキテクチャを提案した。感情次元に対するオーディオビジュアルデータのエンドツーエンドマッピングは,2ストリームネットワークがその単一ストリーム対応物よりも優れていることを明らかにした。CNNsによって学習された表現は,最小冗長性最大関連性統計選択法を通して精密化される。次に,選択したCNNベースの特徴に適用したサポートベクトル回帰により,感情次元の瞬時値を推定した。提案した方法を訓練し,良く知られたRECOLAとSEMAINEデータベースのオーディオビジュアル変換を用いてテストした。実験的には,CNNベースの特徴の回帰が,従来のオーディオビジュアル感情特徴およびエンドツーエンドCNNマッピングより優れていることを検証した。一般化実験を通して,訓練と試験データセットの設定が広く異なるとき,学習表現が許容できる予測性能を提供するのに十分ロバストであることも観察される。Copyright 2019 Elsevier B.V., Amsterdam. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】

, , , , , , , , , ,
, , , , 【Automatic Indexing@JST】

著者キーワード (3件)： , ,

パターン認識

, , , ,

前のページに戻る