プレプリント
J-GLOBAL ID:202202213649068257   整理番号:22P0306445

視覚変圧器について知っておくべき3つのもの【JST・京大機械翻訳】

Three things everyone should know about Vision Transformers
著者 (5件):
資料名:
発行年: 2022年03月18日  プレプリントサーバーでの情報更新日: 2022年03月18日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
自然言語処理における最初の成功の後,変圧器アーキテクチャはコンピュータビジョンにおいて急速に牽引を得て,画像分類,検出,セグメンテーション,およびビデオ分析のようなタスクのための最新の結果を提供した。視覚変圧器のバリアントを実装する簡単で容易な3つの洞察を提供する。(1)通常処理される視覚変圧器の残留層は,精度に大きく影響することなく並列に効率的に処理できる。(2)注意層の重みの微調整は,ビジョン変圧器をより高い解像度および他の分類タスクに適応させるのに十分である。これは,計算を節約し,微調整時間におけるピークメモリ消費を低減し,タスク間の重みの大部分を共有できる。(3)MLPベースパッチ前処理層の添加はパッチマスキングに基づくBert様自己監督訓練を改善する。ImageNet-1kデータセットを用いてこれらの設計選択の影響を評価し,ImageNet-v2テストセットに関する著者らの発見を確認した。転送性能を6つのより小さなデータセットにわたって測定した。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識  ,  図形・画像処理一般 
タイトルに関連する用語 (2件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る