抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本論文では,大規模構成における最近の切断エッジ変換器ベース符号器のアンサンブルに焦点を当てて,GECシーケンス標識アーキテクチャの改善を検討した。このアプローチがモデルアーキテクチャと語彙サイズに対して耐性であるので,スパンレベル編集に関する大多数投票によるアンサンブルモデルを奨励する。最良のアンサンブルは,合成データセットの事前訓練なしでも,BEA-2019(テスト)で76.05のF_0.5スコアを有する新しいSOTA結果を達成した。さらに,新しい合成訓練データセット「Troy-Blog」と「Troy-1BW」を生成するために,訓練されたアンサンブルによる知識蒸留を行った。公開利用可能な合成PIEデータセットと組み合わせた,生成されたTroyデータセット上で事前訓練された最良の単一シーケンス標識モデルは,近SOTA(著者らの知識の最良)を達成し,著者らの最良の単一モデルは,BEA-2019(テスト)で73.21のF_0.5スコアで,はるかに重いT5モデルの結果だけを与える。コード,データセットおよび訓練されたモデルは,公的に利用可能である。【JST・京大機械翻訳】