抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
Deep Learning(深層学習)におけるモデル圧縮手法の一つとしてプルーニングが知られている.プルーニングにより重要度の低い重みを削除することにより,高い認識精度を維持しつつモデルのサイズを削減することができる.またその結果,重み行列は疎行列として表現されることになる.しかし,プルーニングによって得られる疎行列は科学技術計算などに用いられる疎行列と異なり,ランダム性の高いものとなっており,非零要素の局所性を活かした高速化は困難である.本稿では,ランダム性の高い疎行列を対象としたSpMM(疎行列密行列積)の高速化手法を報告する.本提案手法をResNet50に対して適用し,NEC SX-Aurora TSUBASA上で評価を行った.ベンダ提供のBLASライブラリ使用時に対して提案手法を適用した層では1コアで最大2.78倍の速度向上,モデル全体では8コアで1.98倍の速度向上がそれぞれ得られた.(著者抄録)