実用的入力摂動に対する深層学習ベーステキスト分類アルゴリズムの感度について【JST・京大機械翻訳】

Miyajiwala Aamir; Ladkat Arnav; Jagadale Samiksha; Joshi Raviraj

プレプリント

J-GLOBAL ID：202202220926763800 整理番号：22P0022555

実用的入力摂動に対する深層学習ベーステキスト分類アルゴリズムの感度について【JST・京大機械翻訳】

On Sensitivity of Deep Learning Based Text Classification Algorithms to Practical Input Perturbations

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (4件)： , , ,
資料名：
発行年： 2022年01月02日プレプリントサーバーでの情報更新日： 2022年01月23日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

※このプレプリント論文は学術誌に掲載済みです。なお、学術誌掲載の際には一部内容が変更されている可能性があります。

テキスト分類は,多様なアプリケーションを持つ基本的な自然言語処理タスクであり,そこでは,深層学習手法が最先端の結果を生み出している。これらのモデルはブラックボックスの性質に対して非常に批判されてきたが,入力テキストにおけるわずかな摂動に対するロバスト性は懸念事項である。本研究では,CNN,LSTMおよびBERTベースアルゴリズムのような深層学習ベーステキスト分類モデルの性能に対する系統的実用的摂動の影響を評価するデータ焦点研究を行った。摂動は,モデルの最終性能に最小に関連する点字と停止語のような不要なトークンの付加と除去によって誘起される。BERTを含むこれらの深層学習手法は,4つの標準ベンチマークデータセットSST2,TREC-6,BBCニュース,およびツイートエバに対するそのような正当な入力摂動に敏感であることを示した。BERTはトークンの添加に比べてトークンの除去により敏感であることを観測した。さらに,LSTMはCNNベースのモデルと比較して入力摂動に対してわずかに敏感であった。また,本研究は,モデルの最終性能に対する列車試験条件における不一致の影響を評価するための実用的な指針として役立つ。【JST・京大機械翻訳】

, , , , , , , , , ,
, , , , 【Automatic Indexing@JST】

人工知能 , 自然語処理

, , , ,

前のページに戻る