抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
音声感情認識(SER)は,音声信号から個人の感情状態を推論する技術に言及する。SERは,それらの広い応用性のために,ガーナの興味を続けている。ドメインは主に信号処理,機械学習,および深層学習に見出されるが,言語を一般化するのは課題として残っている。しかし,一般化可能かつ移転可能なモデルを開発することは,最も一般的に話されたものを超えた言語に対するデータおよびラベルに関する十分な資源の欠如により重要である。言語上の性能を改善するために,著者らは,活性化または原子価のいずれかに基づく連続メトリック損失を用いて,セミスーパービジョンを有する雑音除去オートエンコーダを提案した。本研究の新規性は,著者らの知識の最良の話題に関する最初の提案である連続メトリック学習の提案にある。さらに,転送データセットにおける活性化と原子価ラベルの欠如に対処するために,著者らは,感情の次元モデルに対応する活性化と原子価レベルを有する信号サンプルを注釈付けし,次に,転送データセット上の埋込みの品質を評価するために使用した。提案した半教師つきモデルは,従来の雑音除去自動符号化器であるベースライン教師なし法よりも,感情分類精度および次元変数に関する相関に関して,一貫して性能が優れていることを示した。参照に関する分類精度のさらなる評価,BERTベースの音声表現モデルは,提案方法がはるかに低い複雑性で特定の感情クラスを分類する際に参照法に匹敵することを示した。【JST・京大機械翻訳】