DOMツリー上のグラフニューラルネットワークと文埋込みによるWeb画像文脈抽出【JST・京大機械翻訳】

Dang Chen; Randrianarivo Hicham; Fournier-S’niehotta Raphaeel; Audebert Nicolas

文献

J-GLOBAL ID：202202272695223082 整理番号：22A0778033

DOMツリー上のグラフニューラルネットワークと文埋込みによるWeb画像文脈抽出【JST・京大機械翻訳】

Web Image Context Extraction with Graph Neural Networks and Sentence Embeddings on the DOM Tree

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=22A0778033&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=22A0778033&from=J-GLOBAL&jstjournalNo=W5071A") }}

著者 (4件)： , , ,
資料名：
巻： 1524 ページ： 258-267 発行年： 2022年
JST資料番号： W5071A ISSN： 1865-0929 資料種別：会議録 (C)
記事区分：原著論文発行国：ドイツ (DEU) 言語：英語 (EN)

Web画像コンテキスト抽出(WICE)は,周囲のWebページの内容を用いて画像を記述するテキスト情報を得ることからなる。WICEを実行する前の一般的な前処理ステップは,Webページの内容をレンダリングすることである。大規模(例えば,検索エンジンインデクシング)で行われるとき,それは非常に計算的に高価になる(ページ当たり数秒まで)。このコストを避けるため,グラフニューラルネットワーク(GNN)と自然言語処理モデルを組み合わせた新しいWICE手法を導入した。この方法は特徴としてノードタイプとテキストの両方を含むグラフモデルに依存する。このモデルを,テキストコンテキストを抽出するために,GNNのいくつかのブロックを通して供給した。グラウンドトルースを有するラベル付きWICEデータセットが存在しないので,画像キャプションに対する意味的に最も近いテキストの発見からなるプロキシタスクに関するGNNを訓練し,評価した。次に,最も重要な重みを解釈して,最も関連するテキストノードを見つけ,それらを画像コンテキストとして定義する。GNNのおかげで,本モデルはWebページから構造的および意味的情報の両方を符号化できる。このアプローチがHTMLデータだけを用いて大規模WICE問題に対処するのを助ける有望な結果を与えることを示した。Copyright Springer Nature Switzerland AG 2021 Translated from English into Japanese by JST.【JST・京大機械翻訳】

, , , , , , , , ,
, , , , , 【Automatic Indexing@JST】

著者キーワード (4件)： , , ,

パターン認識 , 図形・画像処理一般 , その他の情報処理

, , , , ,

前のページに戻る