抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
最近,訓練後量子化(PTQ)は,長時間再訓練なしで効率的なニューラルネットワークを生成する多くの注目を集めている。その低コストにもかかわらず,現在のPTQは極めて低いビット設定の下で失敗する傾向がある。本研究では,PTQ再構成に活性化量子化を適切に組み入れることが最終精度に利益を与えることを確認した。固有の理由を深く理解するために,理論的枠組みを確立し,キャリブレーションと試験データに関する最適化低ビットモデルの平坦性が重要であることを示した。この結論に基づき,QDROPとして,単純だが効果的なアプローチを提案し,PTQ中の活性化の量子化をランダムに低下させた。コンピュータビジョン(画像分類,物体検出)および自然言語処理(テキスト分類および質問回答)を含む様々なタスクに関する広範な実験は,その優位性を証明した。QDROPにより,PTQの限界は,初めて2ビット活性化に押し込まれ,そして,精度ブーストは,51.49%に達することができた。ベルと whistのない場合,QDROPはPTQの最新技術を確立した。著者らのコードはhttps://github.com/wimh966/QDropで利用可能であり,MQBench(https://github.com/ModelTC/MQBench)に統合されている。【JST・京大機械翻訳】