マスクされたオートエンコーダを理解する方法【JST・京大機械翻訳】

Cao Shuhao; Xu Peng; Clifton David A.

プレプリント

J-GLOBAL ID：202202216187618727 整理番号：22P0286282

マスクされたオートエンコーダを理解する方法【JST・京大機械翻訳】

How to Understand Masked Autoencoders

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (3件)： , ,
資料名：
発行年： 2022年02月08日プレプリントサーバーでの情報更新日： 2022年02月09日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

「Masked Autoencoder (MAE) Are Scalable Vision Learners」は,画像事前訓練のための最先端技術を達成するだけでなく,視覚と言語マスク自動符号化(BERTスタイル)予訓練の間のギャップを橋渡しするマイルストーンである。しかし,知る限りでは,MAEの強力な発現を説明する理論的展望はない。本論文では,MAEに対する数学的理解を提供する統一理論フレームワークを提案した。特に,非重複領域分解設定の下で積分カーネルを用いたMAEのパッチベース注意アプローチを説明した。MAEの大きな成功の主な理由をさらに理解するための研究コミュニティを助けるために,著者らのフレームワークに基づいて,著者らは5つの疑問を提起して,オペレータ理論からの洞察を用いて数学的なリグによってそれらに答えた。【JST・京大機械翻訳】

, , , , ,
, , 【Automatic Indexing@JST】

図形・画像処理一般 , 人工知能

, ,

前のページに戻る