文献
J-GLOBAL ID:202202298118014774   整理番号:22A1039318

ハイブリッド畳込みニューラルネットワークを用いたRAVDESS音声に対する音声の感情の検出【JST・京大機械翻訳】

Detection of Emotion of Speech for RAVDESS Audio Using Hybrid Convolution Neural Network
著者 (8件):
資料名:
巻: 2022  ページ: Null  発行年: 2022年 
JST資料番号: U7772A  ISSN: 2040-2295  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: イギリス (GBR)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
あらゆる人間は,それらに関連するあらゆる項目に対して感情を持っている。あらゆる顧客に対して,それらの感情は顧客がそれらの要求を理解するのを助けることができる。したがって,音声感情認識は人間間の相互作用において重要な役割を果たす。現在,知的システムは,正,負,またはより特異的のような異なるカテゴリーにおける感情を分類できる畳み込みニューラルネットワーク(CNN)ベースのネットワークを設計する性能の改善を助けることができる。本論文では,Emotional Speech and Song(RAVDESS)オーディオ記録のRyson Audio-Visualデータベースを用いた。Log Mel SpectrogramとMel-Frequency Cepstral係数(MFCC)を用いて,生のオーディオファイルを特徴づけた。これらの特性を,Long Short-Term記憶(LSTM),CNN,隠れMarkovモデル(HMM),および深層ニューラルネットワーク(DNN)のような技術を用いて,感情の分類に用いた。本論文では,感情を男性と女性の3つのセクションに分割した。第1節では,感情を正として2つのクラスに分割する。第2節では,感情を正,負,および中立のような3つのクラスに分割する。第3のセクションでは,感情を,幸福, s, an,恐怖,驚き,嫌悪な表現, cal,および恐怖な感情のような8つの異なるクラスに分割する。これらの3つのセクションに対して,2D畳込みニューラル法の8つの連続層を含むモデルを提案した。意図されたモデルは,他の以前に与えられたモデルに対して,より優れた性能のあるカテゴリーを与える。現在,より良い方法で消費者の感情を同定できる。Copyright 2022 Tanvi Puri et al. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識 
引用文献 (31件):
  • M. Khan, T. Goskula, M. Nasiruddin, R. Quazi, "Comparison between k-nn and svm method for speech emotion recognition," International Journal on Computer Science and Engineering, vol. 3, no. 2, pp. 607-611, 2011.
  • J. Rong, G. Li, Y.-P. P. Chen, "Acoustic feature selection for automatic emotion recognition from speech," Information Processing & Management, vol. 45, no. 3, pp. 315-328, 2009.
  • M. El Ayadi, M. S. Kamel, F. Karray, "Survey on speech emotion recognition: features, classification schemes, and databases," Pattern Recognition, vol. 44, no. 3, pp. 572-587, 2011.
  • S. G. Koolagudi, K. S. Rao, "Emotion recognition from speech: a review," International Journal of Speech Technology, vol. 15, no. 2, pp. 99-117, 2012.
  • C.-N. Anagnostopoulos, T. Iliou, I. Giannoukos, "Features and classifiers for emotion recognition from speech: a survey from 2000 to 2011," Artificial Intelligence Review, vol. 43, no. 2, pp. 155-177, 2015.
もっと見る
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る