文献
J-GLOBAL ID:201902271562463858   整理番号:19A1664986

ニューラル機械翻訳モデルの並列化訓練のためのテンソル蓄積中の記憶効率とMPI集団性能を改善する仮想スパーステンソルの高密度化【JST・京大機械翻訳】

Densifying Assumed-Sparse Tensors Improving Memory Efficiency and MPI Collective Performance During Tensor Accumulation for Parallelized Training of Neural Machine Translation Models
著者 (14件):
資料名:
巻: 11501  ページ: 23-39  発行年: 2019年 
JST資料番号: H0078D  ISSN: 0302-9743  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: ドイツ (DEU)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
人間の言語を翻訳するためのニューラルネットワークを用いた神経機械翻訳は,機械翻訳性能を劇的に改善する目的で,新しいニューロンタイプとネットワークトポロジーを探索する活発な研究の領域である。現在の最先端のアプローチは,マルチヘッドの注意ベースの変圧器のような,非常に大きな翻訳コーパスと多くのエポックを必要とし,合理的な品質のモデルを作り出す。複数のノードを横切る公式のTensorFlow変換器モデルを並列化する最近の試みは,過剰なメモリ使用によりロードブロックをヒットし,MPI収集を実行するときのメモリ誤りの結果となる。本論文では,保証スパーステンソルを高密度テンソルに変換することにより,変圧器モデルに対するメモリ使用を低減するために,Horovod MPIに基づく分散訓練フレームワークに対する修正を記述し,次に,高密度勾配縮小によるスパース勾配収集を置き換えた。結果はスケールアウト能力の劇的な増加であり,CPUのみのスケーリング試験では,1200MPIプロセス(300ノード)まで91%の弱いスケーリング効率を達成し,Stampedge2スーパーコンピュータを用いた400MPIプロセス(200ノード)まで最大65%の強いスケーリング効率を達成した。Copyright 2019 Springer Nature Switzerland AG Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
分子・遺伝情報処理  ,  計算機網 

前のページに戻る