抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
生成モデルの急速な発展により,AI生成コンテンツの識別は,産業と学界の両方からますます注目を集めている。本論文では,「AI生成画像検出のタスクが解決されたかどうか」に関するサニティチェックを行った。始めに,人間の知覚にとって真に挑戦的なAI生成画像からなるカメレオンデータセットを提案した。既存手法の一般化を定量化するために,カメレオンデータセット上で9つの既製AI生成画像検出器を評価した。解析では,ほとんどすべてのモデルがAI生成画像を実画像に分類する。後に,視覚的アーチファクトと雑音パターンを同時に抽出するために複数の専門家を利用するAIDE(ハイブリッド特徴を持つAI生成画像デテクター)を提案した。特に,高水準意味論を獲得するために,ビジュアル埋込みを計算するためにCLIPを利用した。これにより,意味論または文脈情報に基づいてAI生成画像を識別するモデルを効果的に可能にした。第二に,著者らは画像の中で最も高い周波数パッチと最も低い周波数パッチを選択して,低レベルのアーチファクト,例えばノイズパターン,アンチエイリアシングなどによってAI生成画像を検出することを目指して,低レベルのパッチワイズ特性を計算した。既存のベンチマーク,例えばAIGCDetectBenchmarkとGenImageで評価すると,AIDEは最先端の方法に対して+3.5%と+4.6%の改善を達成し,また,著者らの提案した挑戦的なカメレオンベンチマークでは,AI生成画像を検出するためのこの問題は解決されていないにもかかわらず,有望な結果を達成した。【JST機械翻訳】