コントラスト視覚意味論的プレトレーニングは自然言語表現の意味論を拡大する【JST・京大機械翻訳】

Wolfe Robert; Caliskan Aylin

プレプリント

J-GLOBAL ID：202202212040526236 整理番号：22P0304161

コントラスト視覚意味論的プレトレーニングは自然言語表現の意味論を拡大する【JST・京大機械翻訳】

Contrastive Visual Semantic Pretraining Magnifies the Semantics of Natural Language Representations

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (2件)： ,
資料名：
発行年： 2022年03月14日プレプリントサーバーでの情報更新日： 2022年03月14日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

GPT-2とCLIPにより形成される文脈化英語言語表現の幾何学と意味特性を比較することにより,画像キャップを符号化するためにGPT-2アーキテクチャを適応させるゼロショットマルチモーダル画像分類器である,コントラスト視覚意味事前訓練の効果を調べる。コントラスト的視覚意味予訓練は,GPT-2の層内自己相似性(平均対余弦類似性)が,GPT-2の最上層において0.95より大きいことと比較して,GPT-2からの文脈化単語埋込みにおいて見い出された異方性を著しく緩和することを発見した。”CLIP単語埋込み”の層内自己相似性(平均対余弦類似性)は,全層において0.25以下であった。CLIP単語埋込みは,単語レベルの意味的固有評価タスクでGPT-2を凌駕し,0.88でRG65評価のための最新のコーパスベース状態を達成した。また,CLIPは文の細粒意味表現を形成し,GPT-2のどの層においてもrho=0.45より大きくないように,SemEval-2017セマンティックTextual Textuality Benchmarkにおいて,SemEval-2017意味的類似性Benchmark上でSpearmanのrho=0.73を得た。最後に,CLIP文埋込みの層内自己相似性は,層指数が増加するにつれて減少し,最上層で0.25で終了し,一方,EOSトークンを用いて形成したGPT-2文章埋込みの自己相似性は,層オーバー層を増加させ,0.97以下では減少しなかった。その結果,高異方性は文脈化の必然的結果ではなく,視覚意味予訓練は視覚表現を順序付けするだけでなく,単語レベルおよび文章レベルの両者で言語の有用な意味表現を符号化するために有益であることを示した。【JST・京大機械翻訳】

, , , , , , , , , , , ,
, , 【Automatic Indexing@JST】

人工知能 , パターン認識 , 自然語処理

, , , ,

前のページに戻る