プレプリント
J-GLOBAL ID:202202204322814231   整理番号:22P0310861

深さフォーマ:正確な単眼深さ推定のための長距離相関と局所情報の活用【JST・京大機械翻訳】

DepthFormer: Exploiting Long-Range Correlation and Local Information for Accurate Monocular Depth Estimation
著者 (4件):
資料名:
発行年: 2022年03月27日  プレプリントサーバーでの情報更新日: 2022年03月27日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
※このプレプリント論文は学術誌に掲載済みです。なお、学術誌掲載の際には一部内容が変更されている可能性があります。
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本論文は,教師つき単眼深度推定の問題に対処することを目的とする。長範囲相関が正確な深度推定に必須であることを実証するために,著者らは,注意深いパイロット研究を開始した。したがって,著者らは,効果的な注意機構でこのグローバルな文脈をモデル化するために,変換器を活用することを提案する。また,変換器がそのようなコンテンツのモデリングにおいて空間帰納的バイアスを欠いているので,付加的畳込み分岐を,局所情報を保存するために採用した。しかし,独立枝は特徴間の接続の不足につながる。このギャップを埋めるために,階層的凝集と不均一相互作用モジュールを設計し,要素毎の相互作用を介して変換器特性を増強し,セットツーセット変換方式で変換器とCNN特徴間の親和性をモデル化した。高解像度特徴マップに関するグローバル注意によって引き起こされた不可聴メモリコストのために,著者らは複雑性を減らすために変形可能な方式を導入した。KITTI,NYU,およびSUN RGB-Dデータセットに関する大規模な実験は,著者らの提案モデルが,深さフォーマルと呼ばれ,顕著なマージンを有する最先端の単眼深度推定法を凌駕することを示した。特に,高競合KITTI深さ推定ベンチマークに関する最も競争力のある結果を達成した。著者らのコードとモデルはhttps://github.com/zhyever/Monocular Depth Estimation Toolboxで利用可能である。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
図形・画像処理一般  ,  人工知能 
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る