抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本稿では,クラスの情報を有効活用することで文書分類タスクに特化したトークン分割の処理を提案する.ユニグラム言語モデルベースのトークン分割器に,エントロピーに基づく重みを掛け合わせることで,あるクラスに特徴的なトークンを優先的に使用するようなトークン分割を行う.実験より,複数の文書分類のデータセットで提案手法による性能の向上が得られることが分かった.また,クラスが未知の場合であっても,疑似的なクラスによって性能の向上が得られる場合があることを報告する.(著者抄録)