抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
動的ニューラルネットワークは,固定アーキテクチャを持つネットワークと比較してより高い表現柔軟性を可能にし,自然言語処理のような入力誘起ネットワーク構造の変化を扱う問題に広く展開されている。静的ネット訓練に用いられる標準最適化の一つは,チップ上の再帰重みの持続性である。動的ネットにおいて,すべての入力のための不均一な計算グラフはGPUレジスタにおけるキャッシング再発重みを防止する。したがって,既存の解決策は,GPU SMsの劣った利用をもたらす複合カーネル発射オーバーヘッドと同様に,過剰な再帰オフチップメモリ負荷を受ける。本論文では,GPU上の動的ニューラルネットワークの訓練中に,重み行列の持続可能性を可能にするソフトウェアシステムを提案した。訓練が始まる前に,著者らの提案アプローチは,仮想パーシステントプロセッサ仕様化(VPPS)と呼ばれ,レジスタ内キャッシングと操作ルーチンを含む前方-後方伝搬カーネルを特殊化する。VVPは,提供された命令を実行するためにガイドされることができるCISCのようなベクトルプロセッサとして,永続的カーネルCTAsを仮想化する。VVPは,チップ上のキャッシング重み行列により全体のオフチップ負荷を大幅に低減し,同時に,動的ネット要求を満たす与えられた計算グラフの形状についてのいかなる仮定も行わないので,最大のporビリティを提供する。著者らは,著者らの解をDynet上に実装し,ユーザに簡単な機能呼を提供することにより,その設計の複雑さを抽出した。Voltaマイクロアーキテクチャに関する著者らの実験は,最も競争力のある解とは異なり,VPPSは小さなバッチサイズでも優れた性能を示し,訓練動的ネット上で最大6xの高速化をもたらすことを示した。Copyright 2019 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】