抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
映画におけるシーンの理解は,ビデオモデレーション,探索,および推薦のような多様なアプリケーションにとって重要である。しかし,個々のシーンのラベリングは時間のかかるプロセスである。対照的に,映画レベルメタデータ(例えば,genre,synopsisなど)は,膜製造プロセスの一部として,規則的に生産され,従って,より一般的に利用できる。本研究では,汎用シーン表現を学習するために映画メタデータを用いる新しいコントラスト学習アプローチを提案した。具体的には,映画類似性の測度を定義するために映画メタデータを使用し,互いに類似した映画のみに対して,ポジティブシーン対に対する著者らの探索を制限するために,コントラスト学習中にそれを使用する。学習されたシーン表現は,複数のベンチマークデータセットを用いて評価された多様なタスクに関する既存の最先端手法よりも一貫して優れている。特に,学習された表現は,LVUデータセットにおける7つの分類タスクと2つの回帰タスクの9.7%の改善に関して7.9%の平均改善を提供する。さらに,新たに収集した映画データセットを用いて,以前にあまり探索されていないタスクに対する一般化可能性を実証するために,ビデオモデレーションタスクのセットに関するシーン表現の比較結果を示した。【JST・京大機械翻訳】