プレプリント
J-GLOBAL ID:202202200819546715   整理番号:22P0287851

F8Net:ネットワーク量子化のための固定点8ビットのみ乗算【JST・京大機械翻訳】

F8Net: Fixed-Point 8-bit Only Multiplication for Network Quantization
著者 (9件):
資料名:
発行年: 2022年02月10日  プレプリントサーバーでの情報更新日: 2022年02月10日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
ニューラルネットワーク量子化は,メモリフットプリントを低減し,エネルギー消費を節約するための有望な圧縮技術であり,実時間推論につながる可能性がある。しかし,量子化と完全精度モデルの間には性能ギャップがある。それを減らすために,既存の量子化手法は,スケーリングまたは量子化のための推論の間,高精度INT32または完全精度乗算を必要とする。これはメモリ,速度,および必要なエネルギーに関して注目すべきコストを導入する。これらの問題に取り組むために,固定点8ビット乗算のみからなる新しい量子化フレームワークであるF8Netを提案した。著者らの方法を引き出すために,著者らは最初に固定点数の異なったフォーマットによる固定点乗算の利点について議論して,関連する不動点数の統計挙動を研究する。第2に,統計的およびアルゴリズム的解析に基づいて,異なる層の重みおよび活性化に対して,異なる固定点フォーマットを適用した。訓練中の各層の正しいフォーマットを自動的に決定するための新しいアルゴリズムを導入した。第3に,固定点演算を用いて,以前の量子化アルゴリズム,パラメータ化クリッピング活性化(PACT)-および再定式化を解析した。最後に,著者らの方法の可能性を示すために,量子化微調整と著者らの固定点アプローチのために最近提案された方法を統一した。MobileNet V1/V2とResNet18/50の画像Net上でF8Netを検証した。本アプローチは,INT32乗算または浮動小数点演算による既存の量子化技術だけでなく,完全精度の対応物に対しても,同等かつ優れた性能を達成し,最先端の性能を達成した。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (3件):
分類
JSTが定めた文献の分類名称とコードです
人工知能  ,  ディジタルフィルタ  ,  図形・画像処理一般 
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る