局所スケール整列単眼ビデオ深さからの3Dシーン再構成に向けて【JST・京大機械翻訳】

Xu Guangkai; Yin Wei; Chen Hao; Shen Chunhua; Cheng Kai; Wu Feng; Zhao Feng

プレプリント

J-GLOBAL ID：202202216003041074 整理番号：22P0284082

局所スケール整列単眼ビデオ深さからの3Dシーン再構成に向けて【JST・京大機械翻訳】

Towards 3D Scene Reconstruction from Locally Scale-Aligned Monocular Video Depth

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (7件)： , , , , , ,
資料名：
発行年： 2022年02月03日プレプリントサーバーでの情報更新日： 2023年04月05日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

既存の単眼深度推定法は多様な場面で優れたロバスト性を達成したが,未知のスケールとシフトまでアフィン不変深さを検索できる。しかし,ビデオ深さ推定やビデオからの3Dシーン再構成のようないくつかのビデオベースシナリオでは,フレーム内予測に存在する未知のスケールとシフトは,深さ不整合を引き起こすかもしれない。この問題を解決するため,著者らは,スケールを復元し,非常にスパースなアンカーポイントでシフトする局所加重線形回帰法を提案し,連続フレームに沿ったスケール一貫性を確実にした。広範な実験は,著者らの方法が,いくつかのゼロショットベンチマークで,既存の最先端の手法の性能を50%まで向上できることを示した。さらに,強いロバストな深さモデルを訓練するために,6.3百万RGBD画像を併合した。作成したResNet50バックボーンモデルは最先端のDPT ViT-Largeモデルよりも性能が優れていた。幾何学ベースの再構成法と結合して,著者らは,スパース点のスケール一貫性と単眼法のロバスト性の両方から恩恵を受ける,新しい高密度3Dシーン再構成パイプラインを定式化した。ビデオ上の簡単なフレーム予測を実行することにより,正確な3Dシーン形状を回復することができる。【JST・京大機械翻訳】

, , , , , , , , , , ,
, , , 【Automatic Indexing@JST】

図形・画像処理一般 , パターン認識

, , , , , ,

前のページに戻る