抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
畳み込みニューラルネットワーク(CNN)による画像認識の精度は年々向上しており,それに伴ってモデルはより複雑で大きなものになってきている。モデルサイズを削減するための工夫の一つとして数値表現のbit幅を削減する手法がある。これまで浮動小数点型・固定小数点型などを用いてbit幅を削減する取り組みが多く行われている。その目的は,(1)少ないbit幅による(2)容易な演算によって,(3)高い正解率を得ることである。演算の容易性を考えると浮動小数点型や固定小数点型を用いることは適切である。そこで我々は可変ビンサイズ量子化と呼ぶ手法を導入し,ビンサイズを遺伝的アルゴリズムを用いて最適化することでbit幅提言・正解率向上の観点から最適な数値表現を求める実験を行った。今回は推論時の学習済みパラメータの量子化を対象にした。結果として実験に用いたモデルに対して,固定小数点表現や浮動小数点表現を上回る正解率を出すことができる数値表現を求めることに成功した。その数値表現は比較的固定小数点型に近いものであった。また,この数値表現を用いることで正解率を低下させずに3bitまでbit幅を削減できることがわかった。(著者抄録)