文献
J-GLOBAL ID:201802237468911215   整理番号:18A0725202

ニュース:画像とテキスト処理による記事注釈【JST・京大機械翻訳】

BreakingNews: Article Annotation by Image and Text Processing
著者 (4件):
資料名:
巻: 40  号:ページ: 1072-1085  発行年: 2018年 
JST資料番号: B0519B  ISSN: 0162-8828  CODEN: ITPIDJ  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
最近の深いニューラルネットワークアーキテクチャに基づいて,コンピュータビジョンと自然言語処理の交差点に存在する現在のアプローチは,自動的なキャプショニングまたは画像検索のようなタスクにおいて前例のないブレークスルーを達成した。しかし,これらの学習法のほとんどは,視覚コンテンツを特異的に記述する人間のアノテーションに関連する画像の大規模な訓練集合に依存している。本論文において,著者らはステップをさらに進めて,テキスト記述が画像にゆるく関連するより複雑な事例を調査することを提案した。ここでは,テキストコンテンツが,画像から直接推論されるだけではなく,提案されているが,しばしば含意的であいまいな関係を表現するニュース記事の特別なドメインに焦点を合わせた。ここでは,ソース検出,記事の説明および記事の地理化を含む複数のタスクに対して,構造の大部分を共有する適応CNNアーキテクチャを導入した。本論文では,深い正準相関解析を展開し,大循環距離に基づく新しい損失関数を提案した。さらに,画像,テキストおよびキャプションを含む約100Kのニュース記事を持つ新しいデータセットであるBreakingNewを提示し,不均一メタデータ(GPS座標およびユーザコメントのような)を強化した。このデータセットは,すべての上述の問題を探索するのに適切であることを示し,そのために,様々なDeep学習アーキテクチャを用いてベースライン性能を提供し,テキストと視覚特徴の異なる表現を提供した。非常に有望な結果を報告し,この種の領域における最新の最新技術のいくつかの限界を明らかにした。これは,この分野におけるスパーの進展を助けることを希望する。Copyright 2018 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識  ,  図形・画像処理一般 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る