2022 ADDチャレンジのためのWav2Vec2に基づくVicomtechオーディオ深偽検出システム【JST・京大機械翻訳】

Martin-Donas Juan M.; Alvarez Aitor

プレプリント

J-GLOBAL ID：202202218041080426 整理番号：22P0298223

2022 ADDチャレンジのためのWav2Vec2に基づくVicomtechオーディオ深偽検出システム【JST・京大機械翻訳】

The Vicomtech Audio Deepfake Detection System based on Wav2Vec2 for the 2022 ADD Challenge

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (2件)： ,
資料名：
発行年： 2022年03月03日プレプリントサーバーでの情報更新日： 2022年03月03日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

本論文では,トラック1および2内の2022ADDチャレンジに対する提案システムについて述べた。本手法は,事前訓練wav2vec2特徴抽出器と下流分類器の組合せに基づいており,音声供給オーディオを検出する。この方法は,識別情報を完全に捉えるために,異なる変圧器層で文脈化された音声表現を利用する。さらに,分類モデルを,異なるデータ増強技術を用いて応用シナリオに適用した。ASVspoof 2021と2022ADDチャレンジの両者におけるオーディオ合成検出に対するシステムを評価し,テレフォニックとオーディオコーデックシステム,雑音のあるオーディオ,および部分ディープファクのような現実的な挑戦的な環境において,そのロバスト性と良好な性能を示した。【JST・京大機械翻訳】

, , , , , , , , ,
, , , 【Automatic Indexing@JST】

音声処理

前のページに戻る