文献
J-GLOBAL ID:201902233333705249   整理番号:19A2171889

文符号化器のマルチタスク学習によるテキスト分類モデルの頑健化

著者 (5件):
資料名:
巻: 2019  号: NL-241  ページ: Vol.2019-NL-241,No.25,1-8 (WEB ONLY)  発行年: 2019年08月22日 
JST資料番号: U0451A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
一般的なニューラルテキスト分類モデルは,文をベクトル化する文符号化器と,文ベクトルを基に分類ラベルが付与される確率を計算する分類器からなる。このようなモデルは,特定の単語が出現する文に対し,文意に関わらずその単語との共起頻度が高いラベルに分類しやすくなるという過学習を起こしやすい。これは,文符号化器が分類に強く寄与する単語を過度に反映した文ベクトルを生成するためであると考えられる。この課題に対し本研究では,同じ(異なる)ラベルを持つ文同士のベクトルはベクトル空間で近傍(遠方)に位置すべき,という直感に基づくマルチタスク学習手法を提案する。具体的には,共通のラベルを持つ文同士の文ベクトルが類似するように,文符号化器を通常のテキスト分類タスクおよび同一ラベル判別タスクのマルチタスク学習によって訓練する。同一ラベル判別タスクでは,コーパスからサンプリングした複数の文のうち,どれが入力文と同一のラベルを持つかを判別できるように文符号化器を訓練する。これにより,文符号化に特定の単語が過度に影響するのを抑制し,テキスト分類の性能を改善するような文ベクトルが得られると期待できる。提案手法の有効性を検証するため,単一ラベル分類の6つのデータセットおよび複数ラベル分類の3つのデータセットにおいて,2種類の文符号化器を用いて実験を行った。また,入力が文書であるデータセットについても1種類の文符号化器を用いて実験を行った。これらの実験結果から,6つのデータセットについて全ての文符号化器で提案手法がベースラインを上回る精度を達成し,提案手法の有効性が示された。(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
自然語処理 
引用文献 (17件):
もっと見る
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る