文献
J-GLOBAL ID:202202286650713050   整理番号:22A0446339

言語アグノスティック表現を用いた言語間および多言語環境におけるHate音声の検出【JST・京大機械翻訳】

Detecting Hate Speech in Cross-Lingual and Multi-lingual Settings Using Language Agnostic Representations
著者 (3件):
資料名:
巻: 12702  ページ: 77-87  発行年: 2022年 
JST資料番号: H0078D  ISSN: 0302-9743  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: ドイツ (DEU)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
ヘート音声の自動検出は,自然言語処理コミュニティにおけるブルーム分野である。近年,複数の言語で訓練されたモデルを用い,複数の言語でヘート音声を検出する努力が行われている。さらに,音声検出におけるテキストを表現する言語診断特徴の能力に特別な関心が寄せられている。これは,モデルが複数の言語で訓練されるためであり,次に,モデルと表現の能力を,非意味言語でテストできる。本研究では,単言語,多言語および交差言語設定におけるヘート音声の検出に焦点を当てた。このために,特徴抽出とエンド分類モデルの両方として,言語Agnostic BERT Sentence Embeddings(LabSE)と呼ばれる事前訓練言語モデルを使用した。サポートベクトルマシンとツリーベースモデルのような異なるモデル,特に単語の袋,文字の袋,および多言語BERTから抽出した文章埋込みの表現を試験した。使用したデータセットはSemEval 2019タスク5データセットであり,英語とスペインの移住者と女性に対するヘート音声をカバーする。結果は,特徴抽出としてのLabSEの使用が,モノ言語設定における言語と交差言語設定における両方の言語の性能を改善することを示した。さらに,エンド分類モデルの終わりとしてのLabSEは,スペイン語言語に対するSemEval 2019タスク5データセットの著者によって報告されたものより良好に機能した。Copyright Springer Nature Switzerland AG 2021 Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (3件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識  ,  自然語処理  ,  音声処理 
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る