抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
畳込みニューラルネットワーク(CNN)ベースモデルの大きなクラスからの決定のための「視覚説明の生成,それらをより透明にする手法を提案する。アプローチ 勾配重み付きクラス活性化マッピング(Grad CAM)は,ターゲットの概念(イヌ’または字幕もロジットを)の勾配,概念を予測するための画像中の重要な領域を強調表示し粗局在地図を作成し最終畳込み層に流入することを使用している。以前のアプローチとは異なり,Grad CAMは,多種多様なCNNモデルファミリーに適用可能である(1)完全結合層(例えばVGG)を伴うCNNs(Cellular Neural Networks,(2)構造化出力(例えば字幕)に使用されるCNN,(3)マルチモーダル入力(例えば視覚質問応答)または強化学習を用いた作業で使用したCNN,建築変化または再訓練はなかった。高分解能クラス識別可視化誘導Grad CAM,を作成し,画像分類,画像字幕,視覚質問応答(VQA)モデル,ResNetベースアーキテクチャを含むにそれを適用するGrad CAMを組み合わせる既存の細粒の可視化。画像分類モデルの文脈では,著者らの可視化(a)は,これらのモデルの破壊モード(一見不合理な予測は合理的な説明を持っていることを示す)への洞察を与える,(b)ILSVRC15弱教師つき位置決めタスクに対する以前の方法より性能が優れている,(c)は基礎となるモデルに忠実な,(d)データセットバイアスを同定することにより,モデル一般化を達成する。画像字幕とVQAに対して,著者らの可視化は,非注意ベースモデルは,入力局在化さえ示した。最後に,Grad CAM説明は,ユーザが深いネットワークからの予測における適切な信頼を確立するのを支援するかどうかを測定するためにヒト研究を設計,実施,両者は同一の予測を行う場合でもGrad CAMは訓練されていないユーザは,「弱い」から「強い」深いネットワークを成功裏に役立つことが分かった。著者らのコードであるyoutu。be/COjUB9Izk6EでCloudCV[2]およびビデオ上でデモとhttps://github.com/ramprs/grad cam/alongで利用可能である。Copyright 2018 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】