文献
J-GLOBAL ID:202102230512616085   整理番号:21A2488484

ビデオにおける品質ファッション検索のためのビジュアルオーディオ合成アラインメントネットワークの探索【JST・京大機械翻訳】

Exploring Visual-Audio Composition Alignment Network for Quality Fashion Retrieval in Video
著者 (8件):
資料名:
巻: 2021  号: ICASSP  ページ: 8178-8182  発行年: 2021年 
JST資料番号: W2441A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
ビデオにおけるファッション検索は,不完全な視覚表現の課題と,E-商業環境下での検索結果の低い品質に悩まされる。これまでの研究は,一般的に視覚透視のみから同一画像を探索することに焦点を合わせているが,高品質商品に対するマルチモーダル情報をレバーするという欠点がある。交差ドメイン問題として,命令または表示オーディオは,ビデオツーショップタスクをファシリライトするための豊富な意味情報を明らかにする。本論文では,ビデオにおける品質ファッション検索を取り扱うために,新しいVisual-Audio構成Alignment Network(VACANet)を提案した。最初に,視覚とオーディオストリームの両方から意味的埋込みを学習することにより,意図的および残留エンティティを識別することを目的として,VACANetにおける視覚-オーディオ構成モジュールを導入した。次に,品質アラインメント訓練方式を,ビデオ対画像適応のための品質意識三重項マイニングとドメインアラインメント制約によって設計した。最後に,挑戦的なビデオデータセット上で行われた広範な実験は,品質ファッション検索の軽減における著者らのモデルのスケーラブルな有効性を実証した。Copyright 2021 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
図形・画像処理一般 
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る