抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
一般的なニューラルテキスト分類モデルは,文をベクトル化する文符号化器と,文ベクトルを基に分類ラベルが付与される確率を計算する分類器からなる。このようなモデルは,特定の単語が出現する文に対し,文意に関わらずその単語との共起頻度が高いラベルに分類しやすくなるという過学習を起こしやすい。これは,文符号化器が分類に強く寄与する単語を過度に反映した文ベクトルを生成するためであると考えられる。この課題に対し本研究では,同じ(異なる)ラベルを持つ文同士のベクトルはベクトル空間で近傍(遠方)に位置すべき,という直感に基づくマルチタスク学習手法を提案する。具体的には,共通のラベルを持つ文同士の文ベクトルが類似するように,文符号化器を通常のテキスト分類タスクおよび同一ラベル判別タスクのマルチタスク学習によって訓練する。同一ラベル判別タスクでは,コーパスからサンプリングした複数の文のうち,どれが入力文と同一のラベルを持つかを判別できるように文符号化器を訓練する。これにより,文符号化に特定の単語が過度に影響するのを抑制し,テキスト分類の性能を改善するような文ベクトルが得られると期待できる。提案手法の有効性を検証するため,単一ラベル分類の6つのデータセットおよび複数ラベル分類の3つのデータセットにおいて,2種類の文符号化器を用いて実験を行った。また,入力が文書であるデータセットについても1種類の文符号化器を用いて実験を行った。これらの実験結果から,6つのデータセットについて全ての文符号化器で提案手法がベースラインを上回る精度を達成し,提案手法の有効性が示された。(著者抄録)