ビジョン変圧器の最近の進歩:最近の研究と展望【JST・京大機械翻訳】

Islam Khawar

プレプリント

J-GLOBAL ID：202202215466880729 整理番号：22P0298186

ビジョン変圧器の最近の進歩:最近の研究と展望【JST・京大機械翻訳】

Recent Advances in Vision Transformer: A Survey and Outlook of Recent Work

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (1件)：
資料名：
発行年： 2022年03月03日プレプリントサーバーでの情報更新日： 2023年10月17日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

ビジョン変換機(ViT)は,畳込みニューラルネットワーク(CNN)と比較して,様々なビジョンタスクのためのより一般的で支配的技術になっている。コンピュータビジョンにおける要求技術として,Vitsは,長距離関係に焦点を当てながら,様々な視覚問題を首尾よく解決している。本論文では,自己注意機構の基本的概念と背景を紹介する。次に,訓練および試験データセットと同様に,強度および弱点,計算コストに関して記述する最近のトップパーフォーマンスViT方法の包括的な概観を提供した。一般的なベンチマークデータセット上で,様々なViTアルゴリズムと最も代表的なCNN手法の性能を徹底的に比較した。最後に,洞察力のある観察でいくつかの限界を調べ,更なる研究方向を提供した。論文の収集と共にプロジェクトページは,https://github.com/khawar512/ViT Surveyで利用可能である。【JST・京大機械翻訳】

, , , , ,
, , , , 【Automatic Indexing@JST】

パターン認識 , 図形・画像処理一般

, , ,

前のページに戻る