文献
J-GLOBAL ID:202002286953903043   整理番号:20A2462483

DeepSonar:AI合成偽音声の効率的でロバストな検出に向けて【JST・京大機械翻訳】

DeepSonar: Towards Effective and Robust Detection of AI-Synthesized Fake Voices
著者 (7件):
資料名:
号: MM ’20  ページ: 1207-1216  発行年: 2020年 
JST資料番号: D0698C  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
音声合成の最近の進歩により,AI合成偽声は,人間の耳に区別できず,広く応用され,現実的で自然の深いFakesを生成し,社会への実際の脅威を示す。しかし,合成偽声に対する効果的でロバストな検出器は,まだそれらの幼児期にあり,この新たな脅威を完全に取り組むことができない。本論文では,話者認識(SR)システムのニューロン挙動のモニタリング,すなわち,AI合成偽声を識別するための深層ニューラルネットワーク(DNN)に基づく,DeepSonarと名付けた新しいアプローチを考案した。層別ニューロン行動は,安全,ロバスト,解釈可能なDNNの構築に広く用いられている入力間の差を慎重に捉える重要な洞察を提供する。本研究では,生入力よりも分類器へのクリーナー信号の提供において,実とAI合成偽声の間の微妙な差を捉えることができるという推測により,層別ニューロン活性化パターンの電力を利用した。英語と中国語言語の両方を含む3つのデータセット(Google,Baidu等からの市販製品を含む)について実験を行い,偽声を識別する際のDeepSonarの高い検出率(98.1%平均精度)と低誤警報率(約2%誤り率)を確認した。さらに,広範な実験結果は,操作攻撃に対するロバスト性(例えば,音声変換および付加的実世界雑音)も実証した。さらに,本研究は,fakes合成に導入された様々なアーチファクトによって動機づけられ,動揺する代わりに,効果的かつロバストなAI支援マルチメディア偽造法のためのニューロン行動の採用への新しい洞察を提起する。Please refer to this article’s citation page on the publisher website for specific rights information. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
著者キーワード (3件):
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
音声処理 
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る