プレプリント
J-GLOBAL ID:202202218283125912   整理番号:22P0147753

ConcealNet:深い音声感情認識におけるパケット損失隠蔽のためのエンドツーエンドニューラルネットワーク【JST・京大機械翻訳】

ConcealNet: An End-to-end Neural Network for Packet Loss Concealment in Deep Speech Emotion Recognition
著者 (2件):
資料名:
発行年: 2020年05月15日  プレプリントサーバーでの情報更新日: 2020年05月15日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
パケット損失は,音声データ伝送を含むデータ伝送における共通の問題である。これは,ストリーミングアプリケーションや音声感情認識(SER)のようなストリームオーディオデータを利用する広範囲の応用に影響を及ぼす可能性がある。パケット損失会議(PLC)は,パケット損失に直面する技術である。単純なPLCベースラインは,0置換または線形補間である。本論文では,積層リカレント神経細胞で使用できる隠蔽ラッパーを提示する。隠蔽セルは,推論時間でリアルタイムのステップワイズエンドツーエンドPLCを実行する,リカレントニューラルネットワーク(ContalNet)を提供できる。さらに,エンドツーエンド感情予測ニューラルネットワークによる拡張は,失われたフレーム,エンドツーエンドのオーディオからSERを実行するネットワークを提供する。提案したモデルを前述のベースラインに対して比較した。さらに,より良い性能を有する双方向性変異体を利用した。評価のために,連続感情ラベルを持つ長いオーディオトラックを与えられた公開RECOLAデータセットを選択した。ConcealNetは,オーディオの再構成と,それの後に予測した対応する感情の品質に関して評価した。提案したConcealNetモデルは,損失が頻繁に起こる場合でも,長い継続時間で損失を持たない環境において,オーディオ再構成と対応する感情予測の両方に対して,かなりの改善を示した。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
符号理論  ,  音声処理 
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る