文献
J-GLOBAL ID:202202280629667478   整理番号:22A0158627

音声感情認識のための単一周波数フィルタリングと非線形エネルギー演算子を用いた新しい特徴表現【JST・京大機械翻訳】

Novel feature representation using single frequency filtering and nonlinear energy operator for speech emotion recognition
著者 (3件):
資料名:
巻: 120  ページ: Null  発行年: 2022年 
JST資料番号: W1600A  ISSN: 1051-2004  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: オランダ (NLD)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本論文では,音声変調の固有特性を推定し,効率的な感情認識のための瞬時変調スペクトル特徴を提案した。この特徴表現は,単一周波数フィルタリング(SFF)技術と高次非線形エネルギー演算子に基づいている。音声信号をSFFを用いて周波数サブバンドに分解し,関連する非線形エネルギーを高次非線形エネルギー演算子で推定した。次に,ケプストラム解析を用いて特徴ベクトルを実現した。SFF技術の高分解能特性を利用して,良好な時間周波数分解能で選択周波数における音声信号の振幅エンベロープを抽出した。4次非線形エネルギー演算子は変調成分の推定において雑音ロバスト性を提供する。提案した特徴集合を,確率的線形判別スコアリング方式,サポートベクトルマシンおよびランダムフォレスト分類器を用いて,iベクトルモデルを用いて感情認識タスクに対して試験した。結果は,この特徴表現の性能が,広く使用されたスペクトルおよび韻律特徴より優れており,3つの感情データベース,EMODB,FAU-AIBO,およびIEMOCAPに関して,それぞれ85.75%,59.88%,および65.78%の検出精度を達成することを示した。さらに,提案した特徴は,付加的白色Gaussおよび車両雑音の存在下でロバストであることが分かった。Copyright 2022 Elsevier B.V., Amsterdam. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識 

前のページに戻る