プレプリント
J-GLOBAL ID:202202218041080426   整理番号:22P0298223

2022 ADDチャレンジのためのWav2Vec2に基づくVicomtechオーディオ深偽検出システム【JST・京大機械翻訳】

The Vicomtech Audio Deepfake Detection System based on Wav2Vec2 for the 2022 ADD Challenge
著者 (2件):
資料名:
発行年: 2022年03月03日  プレプリントサーバーでの情報更新日: 2022年03月03日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本論文では,トラック1および2内の2022ADDチャレンジに対する提案システムについて述べた。本手法は,事前訓練wav2vec2特徴抽出器と下流分類器の組合せに基づいており,音声供給オーディオを検出する。この方法は,識別情報を完全に捉えるために,異なる変圧器層で文脈化された音声表現を利用する。さらに,分類モデルを,異なるデータ増強技術を用いて応用シナリオに適用した。ASVspoof 2021と2022ADDチャレンジの両者におけるオーディオ合成検出に対するシステムを評価し,テレフォニックとオーディオコーデックシステム,雑音のあるオーディオ,および部分ディープファクのような現実的な挑戦的な環境において,そのロバスト性と良好な性能を示した。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
音声処理 
タイトルに関連する用語 (2件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る