プレプリント
J-GLOBAL ID:202202221112397915   整理番号:22P0328318

自動事後編集のための半教師つき学習の前進:誤り用語を用いたマスクインフィルによるデータ合成【JST機械翻訳】

Advancing Semi-Supervised Learning for Automatic Post-Editing: Data-Synthesis by Mask-Infilling with Erroneous Terms
著者 (3件):
資料名:
発行年: 2022年04月08日  プレプリントサーバーでの情報更新日: 2024年06月03日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
訓練のために合成データを活用する半教師つき学習は,訓練データの欠如のために自動編集後(APE)モデルを開発するために広く採用されている。この目的のために,高品質の合成データを作成するためのデータ合成法に焦点を当てた。APEが入力として誤りを含むかもしれない機械翻訳結果を取ることを考えると,得られた合成データが実際のデータに見られる翻訳誤りを模倣するデータ合成法を提示する。マスク付き言語モデルアプローチを適応化し,誤ったトークンを持つマスク付きトークンを充填することにより,クリーンなテキストからノイズのあるテキストを生成することにより,ノイズに基づくデータ合成手法を提案した。さらに,合成データの品質をさらに強化するために有利なサンプルのみを取ることにより,2つの別々の合成データセットを結合する選択的コーパスインタリービングを提案した。実験結果は,筆者らのアプローチによって作成された合成データを使用すると,既存の手法によって作成された他の合成データよりも著しく優れたAPE性能をもたらすことを示す。【JST機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
自然語処理 

前のページに戻る