抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
視覚的ランドマーク認識システムのタスクはクエリ写真において撮影された建物や物体を特定し,それらに関する関連情報をユーザに与えることである。世界のランドマーク建物や物体の被覆率の増加に伴い,インターネット写真集積は今や完全に自動的な方式でそうしたシステムを構築するための情報源として用いられている。この処理は一般的に3つのステップからなる。すなわち,それらが描写した物体によって膨大な量の画像をクラスタリングすること,ユーザが与えたタグから物体名を決定すること,ロバストでコンパクトで効率的な認識インデックスを構築することである。しかしながら,大規模開集合マイニングや認識タスクでは,それらのステップに対する現在の手法がどれだけうまく実行できるかの実験に基づく情報は今までほとんどない。また,認識性能が異なる種類のランドマーク物体に対してどのように変化し,改善に対する可能性がまだあるかに関する実験に基づく情報もほとんどない。本論文では,それらのギャップを埋めることを目的とした。パリの500kの画像データ集合を用い,次の問いに答えるためにランドマーク認識パイプラインの各構成要素を分析した。すなわち,どのくらいで何種類の物体が自動的に発見できるか?クエリ中の物体を認識するために,結果として生じる画像クラスタをどのように最もうまく使うことができるか?認識のためにメモリにおいて物体をどのように効率的に表現できるか?意味情報はどのくらい確実に抽出されるか?そして最後に,結果として生じるパイプラインにおいてクエリから意味に限定する因子は何か?個々のパイプラインステップに対する方法やパラメータの異なる選択が,全体のシステム性能にどのように影響するかを評価し,建物,絵,彫刻といった異なるクエリカテゴリに対するそれらの影響を調べた。Copyright 2015 Elsevier B.V., Amsterdam. All rights reserved. Translated from English into Japanese by JST.