文献
J-GLOBAL ID:201802224596877310   整理番号:18A0517902

iRDMA:分散型深層学習システムにおけるRDMA(遠隔直接メモリアクセス)の効率的な使用【Powered by NICT】

iRDMA: Efficient Use of RDMA in Distributed Deep Learning Systems
著者 (8件):
資料名:
巻: 2017  号: HPCC/SmartCity/DSS  ページ: 231-238  発行年: 2017年 
JST資料番号: W2441A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
分散深層学習システムは,ユーザ時間制約の下での入力データの大きな体積とのモデル訓練における通信帯域幅に厳しい要求を課している。通信は,地球訓練したモデルを維持するための訓練データとパラメータサーバのための作業者ノードのクラスタ間で主に起こる。高速収束のために従事者ノードとパラメータサーバは迅速に更新を放送と陳腐を最小化するパラメータの十億交換を頻繁にしなければならない。帯域幅オンデマンド計算における専用GPUの導入でも高くなった。RDMAを利用できるネットワークは十分に高い帯域幅を提供する大きな可能性を持っているが,MPIのような,TCP/IPまたは特定のプログラミングモデルにその現在の使用は帯域幅ボトルネックを破壊するその能力を制限している。本研究では,iRDMA,GPUとCPUベース訓練を支援する高速ネットワーク環境のための最適化されたRDMAベースパラメータサーバアーキテクチャを提案した。天然非同期RDMA動詞を利用するネットワークライン速度を達成するために,作業者とパラメータサーバ両側に通信処理コストを最小化した。iRDMAは負荷分散およびフォールトトレランスの便利な担体としてその使いやすさのためのPOSIX互換ファイルAPIとしてパラメータサーバシステムを明らかにした。IBMの深層学習プラットフォームでiRDMAを実装した。実験結果は,著者らの設計は,画像認識と言語分類を含む深い学習応用は分散コンピューティング資源を用いることにより,収束速度と訓練精度加速度にほぼ直線的改善を達成するのを助けることができることを示した。システムの観点から,iRDMAは効率的に分散訓練プロセスの中でモデルを同期させるための高速ネットワークの約95%ネットワーク帯域幅を利用することができる。Copyright 2018 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
計算機網 
タイトルに関連する用語 (2件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る