抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
構造化予測モデルは,出力が単一変数よりむしろ複雑な構造である一種の問題を解決することを目的とする。そのようなモデルに対する知識蒸留の実施は,それらの指数的に大きな出力空間のために自明ではない。本研究では,既存の手法よりも,その定式化においてはるかに簡単で,訓練に対してはるかに効率的である手法を提案した。特に,全出力空間の代わりに,すべてのサブ構造に関するそれらの予測を局所的にマッチングすることにより,教師モデルからその学生モデルへの知識を転送する。このようにして,著者らは,並列計算を可能にし,訓練プロセスを実践でより速くする,復号化出力構造のための動的計画法(DP)のような,いくつかの時間消費技術を採用することを避ける。そのうえ,それは教師モデルの内部挙動をより良く模倣する学生モデルを奨励する。2つの構造化予測タスクに関する実験は,著者らのアプローチが以前の方法より優れて,1つの訓練時期のために時間コストを半分にすることを示した。【JST・京大機械翻訳】