ニュース:画像とテキスト処理による記事注釈【JST・京大機械翻訳】

Ramisa Arnau; Yan Fei; Moreno-Noguer Francesc; Mikolajczyk Krystian

文献

J-GLOBAL ID：201802237468911215 整理番号：18A0725202

ニュース:画像とテキスト処理による記事注釈【JST・京大機械翻訳】

BreakingNews: Article Annotation by Image and Text Processing

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=18A0725202&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=18A0725202&from=J-GLOBAL&jstjournalNo=B0519B") }}

著者 (4件)： , , ,
資料名：
巻： 40 号： 5 ページ： 1072-1085 発行年： 2018年
JST資料番号： B0519B ISSN： 0162-8828 CODEN： ITPIDJ 資料種別：逐次刊行物 (A)
記事区分：原著論文発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

最近の深いニューラルネットワークアーキテクチャに基づいて,コンピュータビジョンと自然言語処理の交差点に存在する現在のアプローチは,自動的なキャプショニングまたは画像検索のようなタスクにおいて前例のないブレークスルーを達成した。しかし,これらの学習法のほとんどは,視覚コンテンツを特異的に記述する人間のアノテーションに関連する画像の大規模な訓練集合に依存している。本論文において,著者らはステップをさらに進めて,テキスト記述が画像にゆるく関連するより複雑な事例を調査することを提案した。ここでは,テキストコンテンツが,画像から直接推論されるだけではなく,提案されているが,しばしば含意的であいまいな関係を表現するニュース記事の特別なドメインに焦点を合わせた。ここでは,ソース検出,記事の説明および記事の地理化を含む複数のタスクに対して,構造の大部分を共有する適応CNNアーキテクチャを導入した。本論文では,深い正準相関解析を展開し,大循環距離に基づく新しい損失関数を提案した。さらに,画像,テキストおよびキャプションを含む約100Kのニュース記事を持つ新しいデータセットであるBreakingNewを提示し,不均一メタデータ(GPS座標およびユーザコメントのような)を強化した。このデータセットは,すべての上述の問題を探索するのに適切であることを示し,そのために,様々なDeep学習アーキテクチャを用いてベースライン性能を提供し,テキストと視覚特徴の異なる表現を提供した。非常に有望な結果を報告し,この種の領域における最新の最新技術のいくつかの限界を明らかにした。これは,この分野におけるスパーの進展を助けることを希望する。Copyright 2018 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【JST・京大機械翻訳】

, , , , , , , , , , , ,
, , 【Automatic Indexing@JST】

パターン認識 , 図形・画像処理一般

, , ,

前のページに戻る