抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
整数アルゴリズムのみのネットワークが,計算コストを低減し,クロスプラットフォームの一貫性を確保するために有効であることを実証した。しかし,従来の研究は,通常,よく訓練された浮動小数(FPN)ネットワークを整数ネットワークに変換するときの推論精度の低下を報告している。この音素を解析し,その低下が活性化量子化によることを見出した。特に,従来のReLUとBounded ReLUとを置き換えると,各ニューロンに対する結合を設定する方法は重要な問題である。活性化量子化誤差とネットワーク学習能力の間のトレードオフを考慮して,著者らは,各々のBounded ReLUの結合を調整するための経験的規則を設定した。また,特徴マップ加算と特徴マップ連結の事例を扱う機構を設計した。提案方法に基づいて,著者らの訓練された8ビット整数ResNetは,画像認識のためにGoogleのTensorFlowとNVIDIAのTensorRTの8ビットネットワークより優れている。また,画像超解像のためのVDSRと圧縮アーチファクト低減のためのVRCNNに関する実験も行い,その両方は,自然的に高い推論精度を必要とする回帰タスクに役立つ。この整数ネットワークは,対応するFPNネットワークとして等価性能を達成したが,1/4メモリコストだけを持ち,最新のGPU上で2xを高速に実行できた。著者らのコードとモデルは,giub/HengRuiZ/breluで見つけることができる。【JST・京大機械翻訳】