文献
J-GLOBAL ID:202002263834832940   整理番号:20A1704672

ニューラル文脈注意を持つ2段階パイプラインを用いたソーシャルテキスト上のタイ語スペリング補正と単語正規化【JST・京大機械翻訳】

Thai Spelling Correction and Word Normalization on Social Text Using a Two-Stage Pipeline With Neural Contextual Attention
著者 (3件):
資料名:
巻:ページ: 133403-133419  発行年: 2020年 
JST資料番号: W2422A  ISSN: 2169-3536  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
テキスト補正システム(例えば,スペルチェッカー)を用いて,エラーの検出と補正によりコンピュータ化テキストの品質を改善した。しかし,タイのソーシャルメディアテキストのためのスペリング補正と単語正規化(テキスト補正)を実行するタスクは,ほとんど未調査のままである。本論文では,タイのソーシャルテキストにおける誤りと単語分散を訂正するための現在のテキスト補正システムがどのように機能するかを検討し,このタスクのために設計した方法を提案した。著者らは,現在利用可能なタイテキスト補正システムが,スペリングエラーと単語分散を修正するのに不十分にロバストであり,一方,英語の文法的誤り訂正のために設計されたテキスト修正器は,過誤(テキスト書き込み)に悩まされることを見出した。したがって,著者らは,神経Seq2Seq補正器の利点を利用して,過剰修正の問題を軽減するために,2段階構造を有するニューラルベースのテキスト補正器を提案した。提案手法は,ニューラルベースの誤り検出器とSeq2Seqニューラル誤り訂正器からなる。この新しいアーキテクチャは,Seq2Seqネットワークが,エンドツーエンド構造の必要性なしに,誤りテキストとそのコンテキストの両方に基づく補正を生成することを可能にする。著者らの方法は,すべての他の評価したテキスト補正システムを凌駕した。第2の最良結果(コピー増強変圧器)と比較して,著者らの方法は,さらに単語エラー率(WER)を2.51%から2.07%に減らし,タイのテキスト補正タスクにおいて,一般化言語評価理解(GLEU)スコアを0.9409から0.9502に改善し,英語スペリング補正タスクにおいて,GLEUスコアを0.7409から0.7539に改善した。Copyright 2020 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (3件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識  ,  自然語処理  ,  音声処理 

前のページに戻る