抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
ディープニューラルネットワーク(DNNs)は様々な人工知能の応用を可能にした。これらの応用は,クラウドコンピューティングインフラストラクチャに役立つモードで走る大きなDNNモデルにより裏づけされている。大DNNモデルの計算集中型性質を与えると,DNN供給システムのための重要な課題は,要求応答待ち時間を最小化することである。本論文では,大規模DNNのためのスケーラブルで応答サービスシステムをサポートするために異なる並列技術の挙動を特性化した。同時にキャッシュ/記憶競合による走行要求の間のDNN負荷均一要求サービス需要,および干渉の二つの重要な特性を同定し,モデル化した。これらの性質はSERFの設計,干渉を意識した待ち行列ベースの解析モデルによって駆動される動的スケジューリングフレームワークの動機づけを行った。いくつかのよく知られたベンチマークを用いた画像分類サービスのコンテクストにおけるSERFを評価した。結果は,正確な遅延予測と変化する負荷条件に適応するその能力を実証した。Copyright 2017 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】