文献
J-GLOBAL ID:201602214219498133   整理番号:16A0267507

「ニューラルネットワーク研究のフロンティア」画像認識のための深層学習の研究動向-畳込みニューラルネットワークとその利用法の発展-

著者 (1件):
資料名:
巻: 31  号:ページ: 169-179  発行年: 2016年03月01日 
JST資料番号: X0330A  ISSN: 2188-2266  資料種別: 逐次刊行物 (A)
記事区分: 解説  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
深層学習は2012年の画像認識コンテストILSVRCでその高い性能と大規模な学習が示された。本論文では,畳込みニューラルネットワーク(CNN)の基本構造とその学習方法を解説し,1)重みの初期化,2)残差学習,3)ドロップアウト,4)確率的勾配降下法による学習時の重みの更新などの研究を概説した。次に,代表的なCNNとして物体カテゴリー認識に有効なAlexNet,層数を増やして局所正規化層を廃したVGGNet,及びGoogLeNetの特徴を説明した。また,ILSVRCのカテゴリー認識のタスクを学習したCNNは機械学習の一般的方法である転移学習に有用であり,シーン認識,ポーズ認識,テクスチャマテリアル認識などのタスクに流用,またはファインチューニングする方法を述べた。さらに,CNNの基本構造の改良研究として,i)多層パーセプトロンを畳込み層の出力部分に組み込んだNetwork-in-Neetwork,ii)受容野の形状を円形に近くしたHex-kernel,iii)プーリング領域の格子間隔を一定確率でランダムにとるFractional Max Pooling,iv)プーリング層を廃したAll CNN,v)プーリングを周波数領域で行うSpectral poolingを紹介した。そのほか画像の入力方法の多様化やCNNの理解を目的とした画像の生成,CNNを用いた画像の合成に関する研究を示した。
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (5件):
分類
JSTが定めた文献の分類名称とコードです
ニューロコンピュータ  ,  人工知能  ,  パターン認識  ,  数値計算  ,  図形・画像処理一般 
引用文献 (63件):
  • [Cimpoi 15] Cimpoi, M., Maji, S., Kokkinos, I. and Vedaldi, A.: Deep filter banks for texture recognition, description, and segmentation, arXiv preprint arXiv:1507.02620 (2015)
  • [Coates 11] Coates, A. and Ng, A.: Selecting receptive fields in deep networks, Advances in Neural Information Processing Systems, pp. 2528-2536 (2011)
  • [Cybenko 89] Cybenko, G.: Approximations by superpositions of sigmoidal functions, Mathematics of Control, Signals, and Systems, Vol. 2, No. 4, pp. 303-314 (1989)
  • [Desjardins 15] Desjardins, G., Simonyan, K., and Pascanu, R.: Natural neural networks, Advances in Neural Information Processing Systems, pp. 2062-2070 (2015)
  • [Donahue 14] Donahue, J., Jia, Y., Vinyals, O., Hoffman, J., Zhang, N., Tzeng, E. and Darrell, T.: DeCAF: A deep convolutional activation feature for generic visual recognition, Proc. ICML (2014)
もっと見る

前のページに戻る