抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
ディープラーニングで用いられるモデルの重みの数は多く,モバイルデバイス上での使用は困難である.そのため,多くの手法が開発されており,量子化はその1つである.通常,ディープラーニングでは演算を32ビット演算精度の浮動小数点で行うが,量子化ではその精度を4ビットなどより少ないビット幅(演算精度)で演算を行い,メモリの軽量化を図る.しかし,従来手法では,ソフトウェア側で量子化したモデルのaccuracyとハードウェア側で実装したモデルのaccuracyに差がある,正規化する際にaccuracyが落ちるという問題がある.そこで本稿では,新たに実装した任意の演算精度を調査可能なフレームワークPyParchを開発し,また,正規化の必要を無くす,ハードウェアに適したモデルを学習する手法について提案する.計算機評価によって,従来手法より演算精度を削減した場合でも十分なaccuracyが得られることが確認できた.従来手法で量子化したモデルはaccuracyを回復するのに18ビット必要だったのに対し,本提案手法は14ビット幅とより少ないビット幅で高いaccuracyを得られた.(著者抄録)