文献
J-GLOBAL ID:202102225769360720   整理番号:21A0539127

音声感情認識のためのマルチチャネル2D畳込みリカレントニューラルネットワーク【JST・京大機械翻訳】

Multi-Channel 2-D Convolutional Recurrent Neural Networks for Speech Emotion Recognition
著者 (3件):
資料名:
巻: 2020  号: CAC  ページ: 5884-5889  発行年: 2020年 
JST資料番号: W2441A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
音声感情認識(SER)は,感情認識の分野で挑戦的なタスクである。SERの性能は,音声から抽出した感情的特徴に大きく依存する。しかしながら,異なる感情的特徴の分布は,不均等で線形に組み合わせ,感情に対する異なる感情的特徴の感度も異なり,それは,感情認識の精度を大きく制限する。この問題を解決するために,マルチチャネル2D畳込み再帰ニューラルネットワークモデルを提案して,それは同じ次元に異なる特徴を写像するために同じチャネル畳込みを使用して,双方向長短期メモリ(Bi-LSTM)ネットワークに入力する各々のチャネルの結果を結合して,最終的にサイレントセグメントの影響を除くために注意機構を使用した。実験を2つのベンチマークコーパスで評価して,結果は,設計したネットワークがSERにおいて良い結果を達成して,IEMOCAPとEMO-DBの平均精度が,それぞれ69.51%と86.42%であることを示した。Copyright 2021 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
図形・画像処理一般 
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る