抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本論文では,Urdu Abusive and Thrating Language検出タスクに関するFIRE共有タスク2021に提出されたシステム記述を提示した。この課題は,Urduで書かれた攻撃的で脅威のあるツイートを自動的に同定することである。競争における第3の認識のために,著者らの提出結果を選択した。本論文では,提出された結果に到達できるようにした実験の非経験リストを報告する。さらに,競争の宣言後に,提出された結果よりもより良い結果を達成するように管理した。著者らのモデルは,タスクA(Urdu TwetsのためのAbusive Language Detection)とタスクB(Urdu Twetsのための言語検出)に関する0.4931F1スコアに関する0.8318F1スコアを達成した。結果は,n=1,2,3の単語nグラムの組合せによって作り出される停止語,補題,および特徴ベクトルを有するサポートベクターマシンが,タスクAのために最良の結果を生み出すことを示した。タスクBでは,停止語を削除したサポートベクターマシン,適用されない補題,事前訓練Urdu Word2Vec(単語ユニグラムとバイグラム)から作成した特徴ベクトル,およびオーバーサンプリング技術を用いてバランスしたデータセットが最良の結果をもたらした。このコードは再現性のために利用できる。【JST・京大機械翻訳】