映画2シーン:シーン表現の学習のための映画メタデータの利用【JST・京大機械翻訳】

Chen Shixing; Liu Chun-Hao; Hao Xiang; Nie Xiaohan; Arap Maxim; Hamid Raffay

プレプリント

J-GLOBAL ID：202202206213544995 整理番号：22P0293262

映画2シーン:シーン表現の学習のための映画メタデータの利用【JST・京大機械翻訳】

Movies2Scenes: Using Movie Metadata to Learn Scene Representation

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (6件)： , , , , ,
資料名：
発行年： 2022年02月21日プレプリントサーバーでの情報更新日： 2023年03月29日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

映画におけるシーンの理解は,ビデオモデレーション,探索,および推薦のような多様なアプリケーションにとって重要である。しかし,個々のシーンのラベリングは時間のかかるプロセスである。対照的に,映画レベルメタデータ(例えば,genre,synopsisなど)は,膜製造プロセスの一部として,規則的に生産され,従って,より一般的に利用できる。本研究では,汎用シーン表現を学習するために映画メタデータを用いる新しいコントラスト学習アプローチを提案した。具体的には,映画類似性の測度を定義するために映画メタデータを使用し,互いに類似した映画のみに対して,ポジティブシーン対に対する著者らの探索を制限するために,コントラスト学習中にそれを使用する。学習されたシーン表現は,複数のベンチマークデータセットを用いて評価された多様なタスクに関する既存の最先端手法よりも一貫して優れている。特に,学習された表現は,LVUデータセットにおける7つの分類タスクと2つの回帰タスクの9.7%の改善に関して7.9%の平均改善を提供する。さらに,新たに収集した映画データセットを用いて,以前にあまり探索されていないタスクに対する一般化可能性を実証するために,ビデオモデレーションタスクのセットに関するシーン表現の比較結果を示した。【JST・京大機械翻訳】

, , , , , , , ,

図形・画像処理一般

, , , ,

前のページに戻る