文献
J-GLOBAL ID:202202217820326453   整理番号:22A0836835

期待値最大化ルーティングと目標双方向合意に基づく自動アラビア語文法誤り訂正【JST・京大機械翻訳】

Automatic Arabic Grammatical Error Correction based on Expectation-Maximization routing and target-bidirectional agreement
著者 (6件):
資料名:
巻: 241  ページ: Null  発行年: 2022年 
JST資料番号: T0426A  ISSN: 0950-7051  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: オランダ (NLD)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
自動Grammar誤り訂正(GEC)は,様々なタイプの構文,pelling,および文法誤差を検出し,補正する。ルールベース,統計的機械翻訳(SMT),およびニューラルマシン翻訳(NMT)のような異なるアプローチが提案されている。これらの手法の中で,seq2seqマルチヘッド注意(トランスフォーマ)に基づくNMTが最良である。多重符号器-デコーダ層を有するGEC seq2seqモデルの主要な欠点は,最上層だけが後続のプロセスで利用されることである。さらに,推論中の曝露バイアス問題のために,いくつかの以前のターゲット単語を削除し,モデル自体によって生成された他の単語によって置換し,それは不満足な出力に導いた。本論文は,アラビアのような低資源言語のためのseq2seq変換機に基づくGECモデルを提案し,これらの問題に対処した。最初に,コーパスの欠如から生じるボトルネックを克服するために,合成並列データを構築するための雑音法を提案した。さらに,コンピュータビジョンにおけるカプセルネットワークの成功によって動機づけられて,著者らは,アラビアGECにおける層を通して情報を動的に集約するために,期待値最大化ルーティングアルゴリズムを使用した。さらに,曝露バイアス問題を克服するために,訓練目的におけるKullback-Leibler発散を用いて双方向正則化項を導入し,右対左および左対右モデル間の一致を改善した。2つのベンチマークQALB-2014とQALB-2015で行った実験は,提案モデルが既存のアラビアGECシステムと比較して最良のF1スコアを達成したことを示した。Copyright 2022 Elsevier B.V., Amsterdam. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (3件):
分類
JSTが定めた文献の分類名称とコードです
人工知能  ,  数値計算  ,  その他のオペレーションズリサーチの手法 

前のページに戻る