抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
ライト検出と測距(LiDAR)の使用は,自律ナビゲーションの精度と性能の継続的な改善を可能にした。最新の応用は,最も高い空間分解能のLiDARを必要とし,実時間で処理する必要がある大量の3D点雲を生成する。本研究では,3D点雲に対する重要な処理カーネルであるk-最近傍(kNN)探索のためのアーキテクチャ設計を検討した。k次元(k-d)ツリーに基づく近似kNN探索を用いて性能を改善した。しかしながら,今日の中規模の問題に対してさえ,この近似kNN探索は,多数のランダムアクセスと最小データ再利用機会により,メモリ帯域幅により厳しく妨げられている。帯域幅ボトルネックを軽減するために,いくつかのメモリ最適化方式を適用した。1)k-dツリーデータ構造を2つの集合に分割した。すなわち,高い再利用を有するツリーノードとポイントバケットを,探索を容易にするために,それらの寿命のためにキャッシュした。一方,低い再利用を有するポイントバケットを,効率的バーストアクセスを容易にするために,外部メモリにおける規則的隣接セグメントにおいて組織化した。2)書込みと読み取りキャッシュを追加して,ランダムアクセスを集めて,それらを逐次アクセスに変換した。そして,3)ツリー構築とツリー探索をインタリーブして,冗長アクセスストリームを切断した。最適化されたメモリ帯域幅で,kNN探索は2つの新しい処理方式によってさらに加速される。1)最小木重複オーバーヘッドを持つ複数の作業者を利用する並列木トラバース,2)ツリー構築のオーバヘッドを最小化する増分木構築,を各時間毎にそれを構築する代わりにツリーを動的に更新することにより最小化する。FPGA上での性能とメモリ最適化QuickNNアーキテクチャを実証し,徹底的ベンチマーキングを実行し,最新CPUとGPU上で実行したk-dツリー検索上で,それぞれ19個と7.3個の高速化を示し,正確な探索を実行する同等サイズアーキテクチャ上で14.5個の高速化を示した。最後に,QuickNNがCPUとGPU法の上でワットの増加に対して2桁の性能を達成することを示した。Copyright 2020 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】