抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
オクルージョンされた人再識別はコンピュータビジョンの挑戦的な領域の一つであり,それは非効率な特徴表現や低い認識精度のような問題に直面している。畳込みニューラルネットワークは,局所特徴の抽出により多くの注意を払い,したがって,閉塞歩行者の特徴を抽出するのは難しく,その効果はそれほど満足されない。最近,ビジョン変圧器は再同定の分野に導入され,パッチシーケンス間の大域的特徴の関係を構築することにより,最も進んだ結果を達成する。しかしながら,局所特徴を抽出する際の視覚変圧器の性能は,畳込みニューラルネットワークのものより劣っている。従って,PFTと呼ぶ部分特徴変圧器ベース人再識別フレームワークを設計した。提案したPFTは,ビジョン変圧器の効率を高めるために3つのモジュールを利用する。1)パッチ全次元増強モジュール。パッチシーケンスとして同じサイズの学習可能なテンソルを設計し,訓練サンプルの多様性を豊かにするパッチシーケンスに完全次元で深く埋め込んだ。(2)融合と再構成モジュール。得られたパッチシーケンスのより重要な部分を抽出し,元のパッチシーケンスを再構成するために元のパッチ配列と融合させた。(3)空間着氷モジュール。パッチシーケンスの短距離相関を効果的に改良できる空間方向からパッチシーケンスをスライスし,グループ化する。閉塞および全体的再同定データセット上での実験結果は,提案したPFTネットワークが,一貫して優れた性能を達成し,最先端の方法より優れていることを実証した。【JST・京大機械翻訳】