ハイブリッド畳込みニューラルネットワークを用いたRAVDESS音声に対する音声の感情の検出【JST・京大機械翻訳】

Puri Tanvi; Soni Mukesh; Dhiman Gaurav; Dhiman Gaurav; Dhiman Gaurav; Ibrahim Khalaf Osamah; alazzam Malik; Raza Khan Ihtiram

文献

J-GLOBAL ID：202202298118014774 整理番号：22A1039318

ハイブリッド畳込みニューラルネットワークを用いたRAVDESS音声に対する音声の感情の検出【JST・京大機械翻訳】

Detection of Emotion of Speech for RAVDESS Audio Using Hybrid Convolution Neural Network

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=22A1039318&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=22A1039318&from=J-GLOBAL&jstjournalNo=U7772A") }}

著者 (8件)： , , , , , , ,
資料名：
巻： 2022 ページ： Null 発行年： 2022年
JST資料番号： U7772A ISSN： 2040-2295 資料種別：逐次刊行物 (A)
記事区分：原著論文発行国：イギリス (GBR) 言語：英語 (EN)

あらゆる人間は,それらに関連するあらゆる項目に対して感情を持っている。あらゆる顧客に対して,それらの感情は顧客がそれらの要求を理解するのを助けることができる。したがって,音声感情認識は人間間の相互作用において重要な役割を果たす。現在,知的システムは,正,負,またはより特異的のような異なるカテゴリーにおける感情を分類できる畳み込みニューラルネットワーク(CNN)ベースのネットワークを設計する性能の改善を助けることができる。本論文では,Emotional Speech and Song(RAVDESS)オーディオ記録のRyson Audio-Visualデータベースを用いた。Log Mel SpectrogramとMel-Frequency Cepstral係数(MFCC)を用いて,生のオーディオファイルを特徴づけた。これらの特性を,Long Short-Term記憶(LSTM),CNN,隠れMarkovモデル(HMM),および深層ニューラルネットワーク(DNN)のような技術を用いて,感情の分類に用いた。本論文では,感情を男性と女性の3つのセクションに分割した。第1節では,感情を正として2つのクラスに分割する。第2節では,感情を正,負,および中立のような3つのクラスに分割する。第3のセクションでは,感情を,幸福, s, an,恐怖,驚き,嫌悪な表現, cal,および恐怖な感情のような8つの異なるクラスに分割する。これらの3つのセクションに対して,2D畳込みニューラル法の8つの連続層を含むモデルを提案した。意図されたモデルは,他の以前に与えられたモデルに対して,より優れた性能のあるカテゴリーを与える。現在,より良い方法で消費者の感情を同定できる。Copyright 2022 Tanvi Puri et al. Translated from English into Japanese by JST.【JST・京大機械翻訳】

, , , , , , , , , , ,
, , , , , 【Automatic Indexing@JST】

パターン認識

引用文献 (31件)：

M. Khan, T. Goskula, M. Nasiruddin, R. Quazi, "Comparison between k-nn and svm method for speech emotion recognition," International Journal on Computer Science and Engineering, vol. 3, no. 2, pp. 607-611, 2011.
J. Rong, G. Li, Y.-P. P. Chen, "Acoustic feature selection for automatic emotion recognition from speech," Information Processing & Management, vol. 45, no. 3, pp. 315-328, 2009.
M. El Ayadi, M. S. Kamel, F. Karray, "Survey on speech emotion recognition: features, classification schemes, and databases," Pattern Recognition, vol. 44, no. 3, pp. 572-587, 2011.
S. G. Koolagudi, K. S. Rao, "Emotion recognition from speech: a review," International Journal of Speech Technology, vol. 15, no. 2, pp. 99-117, 2012.
C.-N. Anagnostopoulos, T. Iliou, I. Giannoukos, "Features and classifiers for emotion recognition from speech: a survey from 2000 to 2011," Artificial Intelligence Review, vol. 43, no. 2, pp. 155-177, 2015.

, ,

前のページに戻る