抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
現在,混雑計数のために,密度マップ推定による完全教師つき方法は主流研究方向である。しかし,そのような方法は,時間消費と労力を要する画像における人の位置レベルアノテーションを必要とする。したがって,計数レベルアノテーションに頼る弱い教師つき方法は緊急に必要である。CNNは大域的コンテキストのモデリングに適していないので,画像パッチ間の相互作用は,CNNによる弱い教師つき学習による群衆計数は,一般的に良好な性能を示すことができない。グローバルコンテキストをモデル化し,コントラスト特徴を学習するために,変換機による弱い教師つきモデルを連続的に提案した。しかし,変圧器は群衆画像を一連のトークンに直接分割し,それは各歩行者が独立した個人であるために良い選択ではなく,ネットワークのパラメータ数は非常に大きい。したがって,本論文では,クラウド計数のための弱い教師つき学習による共同CNNと変換ネットワーク(JCTNet)を提案した。JCTNetは,3つの部分から成る:CNN特徴抽出モジュール(CFM),変圧器特徴抽出モジュール(TFM),および計数回帰モジュール(CRM)。特に,CFMは,意味情報特徴を抽出し,次に,グローバル文脈をモデル化するため,それらのパッチ分割をTRMに送信し,CRMを用いて,人々の数を予測した。大規模な実験と可視化は,JCTNetが群衆領域に効果的に集中し,5つの主流データセットで優れた弱い教師つき計数性能を得ることができることを証明した。モデルのパラメータの数は,純粋な変換装置と比較して約67%~73%低減できた。また,計数レベルアノテーションだけによって制約されたモデルが,群衆領域に焦点を当てることができる現象を説明することを試みた。本研究が,この分野におけるさらなる研究を促進できると信じる。【JST・京大機械翻訳】