文献
J-GLOBAL ID:202202265862856965   整理番号:22A0733690

マルチラベル法文書分類:ラベル注意とドメイン特異的プレトレーニングによる深層学習ベースアプローチ【JST・京大機械翻訳】

Multi-label legal document classification: A deep learning-based approach with label-attention and domain-specific pre-training
著者 (4件):
資料名:
巻: 106  ページ: Null  発行年: 2022年 
JST資料番号: H0277C  ISSN: 0306-4379  CODEN: INSYD6  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: オランダ (NLD)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
マルチラベル文書分類は,ニュース記事トピックタグ付け,感情分析,医療コード分類など様々な実用的問題に対して広い応用性を持ち,マルチラベル文書分類問題のために,様々なアプローチ(例えば,事前訓練言語モデルに基づくニューラルネットワークおよび深層学習システム)が開発され,異なるデータセット上で満足する性能を達成した。”そのために,ツリーベースの方法,ニューラルネットワークおよび深層学習システム”が,マルチラベル文書分類問題のために開発された。”種々のデータセット上では,十分な性能を達成している。”様々なアプローチ(例えば,ツリーベースの方法,ニューラルネットワークおよび深層学習システム)など,様々なデータセットに対して,様々なアプローチ(例えば,ツリーベースの方法,ニューラルネットワークおよび深層学習システムなど)が開発されている。”様々なデータセット上では,多様なアプローチ(例えば,ツリーベースの方法,ニューラルネットワークおよび深層学習システムなど)が開発されている。しかし,法的ドメインでは,マルチラベル分類タスクで動作するとき,1つは,しばしばいくつかの重要課題に直面している。1つの重大な課題は,研究者と実務者がそれぞれのタスクのデセント性能を達成することから,高品質な人間のラベル付きデータセットの欠如である。また,マルチラベル分類に関する既存の方法は,通常,十分な訓練サンプルを持たない他の重要なクラスに対する不満足な性能をもたらす,大多数のクラスに焦点を合わせている。上記の課題に取り組むために,本論文では,まず,研究コミュニティにリリースする新しい法的極端マルチラベル分類データセットであるPOSTURE50Kを提示した。データセットは50,000の法的意見と手動でラベル付けされた法的手続き姿勢を含む。このデータセットのラベルはZipfian分布に従い,少数の試料だけを持つクラスの多くを残している。さらに,マルチラベル文書分類のためのドメイン固有予訓練とラベル注意機構を採用する深層学習アーキテクチャを提案する。POSTURE50Kと別の法的マルチラベルデータセットEUROLEX57Kに関する提案アーキテクチャを評価し,著者らのアプローチが2つのベースラインシステムおよび2つのデータセットに関する他の4つの最新手法よりも優れた性能を達成することを示した。Copyright 2022 Elsevier B.V., Amsterdam. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
人工知能 

前のページに戻る