プレプリント
J-GLOBAL ID:202202216003041074   整理番号:22P0284082

局所スケール整列単眼ビデオ深さからの3Dシーン再構成に向けて【JST・京大機械翻訳】

Towards 3D Scene Reconstruction from Locally Scale-Aligned Monocular Video Depth
著者 (7件):
資料名:
発行年: 2022年02月03日  プレプリントサーバーでの情報更新日: 2023年04月05日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
既存の単眼深度推定法は多様な場面で優れたロバスト性を達成したが,未知のスケールとシフトまでアフィン不変深さを検索できる。しかし,ビデオ深さ推定やビデオからの3Dシーン再構成のようないくつかのビデオベースシナリオでは,フレーム内予測に存在する未知のスケールとシフトは,深さ不整合を引き起こすかもしれない。この問題を解決するため,著者らは,スケールを復元し,非常にスパースなアンカーポイントでシフトする局所加重線形回帰法を提案し,連続フレームに沿ったスケール一貫性を確実にした。広範な実験は,著者らの方法が,いくつかのゼロショットベンチマークで,既存の最先端の手法の性能を50%まで向上できることを示した。さらに,強いロバストな深さモデルを訓練するために,6.3百万RGBD画像を併合した。作成したResNet50バックボーンモデルは最先端のDPT ViT-Largeモデルよりも性能が優れていた。幾何学ベースの再構成法と結合して,著者らは,スパース点のスケール一貫性と単眼法のロバスト性の両方から恩恵を受ける,新しい高密度3Dシーン再構成パイプラインを定式化した。ビデオ上の簡単なフレーム予測を実行することにより,正確な3Dシーン形状を回復することができる。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
図形・画像処理一般  ,  パターン認識 

前のページに戻る