プレプリント
J-GLOBAL ID:202202203085150548   整理番号:22P0322855

位置情報を学習する位置情報のない変圧器言語モデル【JST・京大機械翻訳】

Transformer Language Models without Positional Encodings Still Learn Positional Information
著者 (5件):
資料名:
発行年: 2022年03月30日  プレプリントサーバーでの情報更新日: 2022年12月05日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
GPT-3のようなCausal変圧器言語モデル(LM)は,典型的には位置埋込みのような位置符号化のいくつかの形式を必要とする。しかし,明示的な位置符号化のないLMは,標準モデルとまだ競合しており,この現象は,異なるデータセット,モデルサイズ,およびシーケンス長にわたってロバストであることを示した。プロービング実験は,そのようなモデルがネットワークを通して絶対位置の陰的概念を獲得し,欠測情報を効果的に補償することを明らかにする。因果的注意は,各トークンが,その絶対位置を近似するのに,各トークンが参加できる先行者の数を推論することを可能にした。本知見は,因果LMが明示的位置決め機構だけでなく,原因マスクの効果からも位置認識を誘導するかもしれないことを示す。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
自然語処理  ,  パターン認識 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る