文献
J-GLOBAL ID:202202272695223082   整理番号:22A0778033

DOMツリー上のグラフニューラルネットワークと文埋込みによるWeb画像文脈抽出【JST・京大機械翻訳】

Web Image Context Extraction with Graph Neural Networks and Sentence Embeddings on the DOM Tree
著者 (4件):
資料名:
巻: 1524  ページ: 258-267  発行年: 2022年 
JST資料番号: W5071A  ISSN: 1865-0929  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: ドイツ (DEU)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
Web画像コンテキスト抽出(WICE)は,周囲のWebページの内容を用いて画像を記述するテキスト情報を得ることからなる。WICEを実行する前の一般的な前処理ステップは,Webページの内容をレンダリングすることである。大規模(例えば,検索エンジンインデクシング)で行われるとき,それは非常に計算的に高価になる(ページ当たり数秒まで)。このコストを避けるため,グラフニューラルネットワーク(GNN)と自然言語処理モデルを組み合わせた新しいWICE手法を導入した。この方法は特徴としてノードタイプとテキストの両方を含むグラフモデルに依存する。このモデルを,テキストコンテキストを抽出するために,GNNのいくつかのブロックを通して供給した。グラウンドトルースを有するラベル付きWICEデータセットが存在しないので,画像キャプションに対する意味的に最も近いテキストの発見からなるプロキシタスクに関するGNNを訓練し,評価した。次に,最も重要な重みを解釈して,最も関連するテキストノードを見つけ,それらを画像コンテキストとして定義する。GNNのおかげで,本モデルはWebページから構造的および意味的情報の両方を符号化できる。このアプローチがHTMLデータだけを用いて大規模WICE問題に対処するのを助ける有望な結果を与えることを示した。Copyright Springer Nature Switzerland AG 2021 Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (3件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識  ,  図形・画像処理一般  ,  その他の情報処理 

前のページに戻る