文献
J-GLOBAL ID:202002279132792976   整理番号:20A1972294

データ拡張と複製に基づく中国語文法誤り訂正手法【JST・京大機械翻訳】

Chinese grammatical error correction method based on data augmentation and copy mechanism
著者 (2件):
資料名:
巻: 15  号:ページ: 99-106  発行年: 2020年 
JST資料番号: C2755A  ISSN: 1673-4785  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: 中国 (CHN)  言語: 中国語 (ZH)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
中国語は広く使われる文字として、その同印欧語系文字の自然差のため、中国語初心者に様々な文法誤りがしばしば現れる。本論文では、初心者が中国語の書き起こしに出現する可能性のある誤字、語順の誤りなどに対して、自動化された文法修正方法を提出した。まず第一に,自己注意力モデルにおける複製機構を導入して,新しいC-Transformerモデルを構築する。誤りテキスト列から正しいテキスト列までのテキスト文法の誤り訂正モデルを構築し、次に、公開データセットに基づいて、本文は序列から序列学習の方式を利用して、正しいテキストから対応する異なる形式のエラーテキストを学習し、そして、通順度に基づく設計を行った。意味論と構文計量の誤りテキストスクリーニング法;最後に,中国語文字の特徴に従って,同形および同音語表を構築し,そして,単語リストのマッピングに従って,人工構造エラーサンプルを拡張して,訓練データを拡大した。実験結果は,提案方法が誤り訂正,語順不適切,欠測,冗長性などの誤りをよく修正でき,中国語テキスト文法の誤り訂正標準テスト集合で最も良い結果が得られることを示した。Data from Wanfang. Translated by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
自然語処理  ,  パターン認識 

前のページに戻る