文献
J-GLOBAL ID:201602201814834380   整理番号:16A0024100

ニューラル単語ベクトルのクロスモーダル転移による画像検索の改善

著者 (6件):
資料名:
巻: J98-D  号: 12  ページ: 1451-1463 (WEB ONLY)  発行年: 2015年12月01日 
JST資料番号: U0473A  ISSN: 1881-0225  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
ニューラルネットワーク(NN)によるメディア表現学習の発展が目覚ましい。自然言語処理分野においても,Skip-gram(SG)と呼ばれるNNモデルが注目を集めており,従来法に比べ意味類推性能の高い単語ベクトルが得られることが報告されている。本論文では,SGによる画像検索精度の改善について議論する。具体的には,クロスモーダル転移(CMT),すなわち,単語ベクトルを介して文書のもつ情報を画像特徴量に転移するフレームワークに則り,単語ベクトルの学習にSGを用いた場合の精度改善について検討する。まず,SG単語ベクトルを介したCMTによって,従来法により得られる単語ベクトルを用いた場合よりも高い画像検索精度が得られることを示す。続いて,更にその改善効果を高めることを考え,新たなCMT法として『線形性保存転移法(LPT)』を提案する。LPTは,SG単語ベクトルの顕著な意味類推性能が現れる線形代数的特性に着想を得た方法であり,画像・文書間の関係に加え,SG単語ベクトル空間に内包される線形部分空間上の幾何構造も同時に保存するような転移を行うことで,より効果的なCMTの実現を狙うものである。三つのベンチマークデータを用いた実験によって,実際に精度改善が可能であることを示す。(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識  ,  人工知能 
引用文献 (37件):
  • A. Krizhevsky, I. Sutskever, and G.E. Hinton, "ImageNet classification with deep convolutional neural networks," Proc. Advances in Neural Information Processing Systems (NIPS), pp.1106-1114, 2012.
  • C. Szegedy, W. Liu, Y. Jia, P. Sermanet, S. Reed, D. Anguelov, D. Erhan, V. Vanhoucke, and A. Rabinovich, "Going deeper with convolutions," arXiv preprint arXiv:1409.4842, 2014.
  • R. Girshick, J. Donahue, T. Darrell, and J. Malik, "Rich fkeature hierarchies for accurate object detection and semantic segmentation," Proc. Conf. Computer Vision and Pattern Recognition (CVPR), pp.580-587, 2014.
  • G.E. Dahl, D. Yu, L. Deng, and A. Acero, "Context-dependent pre-trained deep neural networks for largevocabulary speech recognition," IEEE Trans. Audio Speech Language Process., vol.20, no.1, pp.30-41, 2012.
  • T. Mikolov, I. Sutskever, K. Chen, G.S. Corrado, and J. Dean, "Distributed representations of words and phrases and their compositionality," Proc. Advances in Neural Information Processing Systems (NIPS), pp.3111-3119, 2013.
もっと見る
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る