インターネット写真集積からの視覚的ランドマーク認識:大規模評価

WEYAND Tobias; LEIBE Bastian

文献

J-GLOBAL ID：201502246851432556 整理番号：15A0502463

インターネット写真集積からの視覚的ランドマーク認識:大規模評価

Visual landmark recognition from Internet photo collections: A large-scale evaluation

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=15A0502463&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=15A0502463&from=J-GLOBAL&jstjournalNo=W0185A") }}

著者 (2件)： ,
資料名：
巻： 135 ページ： 1-15 発行年： 2015年06月
JST資料番号： W0185A ISSN： 1077-3142 資料種別：逐次刊行物 (A)
記事区分：原著論文発行国：オランダ (NLD) 言語：英語 (EN)

視覚的ランドマーク認識システムのタスクはクエリ写真において撮影された建物や物体を特定し,それらに関する関連情報をユーザに与えることである。世界のランドマーク建物や物体の被覆率の増加に伴い,インターネット写真集積は今や完全に自動的な方式でそうしたシステムを構築するための情報源として用いられている。この処理は一般的に3つのステップからなる。すなわち,それらが描写した物体によって膨大な量の画像をクラスタリングすること,ユーザが与えたタグから物体名を決定すること,ロバストでコンパクトで効率的な認識インデックスを構築することである。しかしながら,大規模開集合マイニングや認識タスクでは,それらのステップに対する現在の手法がどれだけうまく実行できるかの実験に基づく情報は今までほとんどない。また,認識性能が異なる種類のランドマーク物体に対してどのように変化し,改善に対する可能性がまだあるかに関する実験に基づく情報もほとんどない。本論文では,それらのギャップを埋めることを目的とした。パリの500kの画像データ集合を用い,次の問いに答えるためにランドマーク認識パイプラインの各構成要素を分析した。すなわち,どのくらいで何種類の物体が自動的に発見できるか?クエリ中の物体を認識するために,結果として生じる画像クラスタをどのように最もうまく使うことができるか?認識のためにメモリにおいて物体をどのように効率的に表現できるか?意味情報はどのくらい確実に抽出されるか?そして最後に,結果として生じるパイプラインにおいてクエリから意味に限定する因子は何か?個々のパイプラインステップに対する方法やパラメータの異なる選択が,全体のシステム性能にどのように影響するかを評価し,建物,絵,彫刻といった異なるクエリカテゴリに対するそれらの影響を調べた。Copyright 2015 Elsevier B.V., Amsterdam. All rights reserved. Translated from English into Japanese by JST.

, , , , , , , , , , , ,
, ,

パターン認識 , 図形・画像処理一般

, , , , , ,

前のページに戻る