プレプリント
J-GLOBAL ID:202202213665746346   整理番号:22P0304626

エンドツーエンドビデオ学習のためのバッチ正規化の落とし穴について:外科ワークフロー解析に関する研究【JST機械翻訳】

On the Pitfalls of Batch Normalization for End-to-End Video Learning: A Study on Surgical Workflow Analysis
著者 (3件):
資料名:
発行年: 2022年03月15日  プレプリントサーバーでの情報更新日: 2024年04月19日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
※このプレプリント論文は学術誌に掲載済みです。なお、学術誌掲載の際には一部内容が変更されている可能性があります。
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
バッチ正規化(BN)のバッチ中の他のサンプルに依存するユニークな特性は,シーケンスモデリングを含むいくつかのタスクに問題を引き起こすことが知られている。しかし,BN関連問題は,特徴抽出のためのCNN(畳込みニューラルネットワーク)におけるBNのユビキタス利用にもかかわらず,長いビデオ理解のためにほとんど研究されていない。特に,予め訓練された特徴抽出器の欠如が複雑な多段階訓練パイプラインに繋がった外科ワークフロー解析において,BN課題の限られた認識が訓練CNNと時間モデルの利益を最終的に隠す可能性がある。本論文では,ビデオ学習におけるBNの落とし穴を分析し,予測における’不正行為’効果のようなオンラインタスクに固有の課題を含んだ。BNの性質がエンドツーエンド学習のための主要な障害を作り出すことを観察した。しかしながら,BN無しバックボーンを用いることにより,シンプルなCNN-LSTMでさえも,時間的コンテキストを最大化する適切なエンドツーエンド訓練戦略を利用することにより,最先端技術{3つの外科ワークフローベンチマーク上でのカラー{colorrevtwo}を克服する。BNの落とし穴の認識は,手術課題における効果的なエンドツーエンド学習に重要であると結論する。自然ビデオデータセット上での結果の再現により,ここでの洞察がビデオ学習のその他の領域にも利益をもたらすことが期待される。コードはurl{https://gitlab.com/nct_tso_public/pitfalls_bn}で利用可能である。【JST機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
人工知能  ,  パターン認識 

前のページに戻る