抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
計算機ビジョンにおいて,注視推定のための商品ハードウェアを利用することは多くの関心がある。多くの論文は,深い畳込みアーキテクチャに基づくアルゴリズムが,大量市場装置からのストリーミングデータが良好な注視追跡性能を提供できる精度に近づいていることを示している。しかし,ギャップは依然として可能であり,性能ユーザは実際の展開で期待される。改善のための1つの明白な手段は,ほとんどの既存のアプローチの背後にあるいくつかの基本的な技術的仮定と訓練に使用されるデータの統計的性質の間のギャップに関連することを観察した。具体的には,ほとんどの訓練データセットは,ユーザ当たり数百(またはそれ以上)の反復取得を持つユーザの数十人を含む。このデータの非i.i.d.特性は,モデルが,いわゆる混合効果モデルを用いた古典的統計解析において一般的に行われるように,各ユーザからのこのような「反復測定」を明示的に用いた場合,より良い推定が可能であることを示唆する。本論文の目的は,これらの「混合効果」アイデアを,注視推定のための深いニューラルネットワークアーキテクチャ内の統計から,目の画像に基づいて適応させることである。このような定式化により,訓練データの階層構造に関する情報を特異的に利用することが求められる。すなわち,階層構造の各ノードは,数十または数百の反復サンプルを提供するユーザである。この改良により,種々の公開可能なデータセットに関する最新の性能の状態を提供するアーキテクチャが得られ,結果は10~20%改善された。Copyright 2020 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】