テキスト分類のためのより多くの訓練サンプルが必要か?【JST・京大機械翻訳】

Zheng Wanwan; Jin Mingzhe

文献

J-GLOBAL ID：202002276661411487 整理番号：20A1997370

テキスト分類のためのより多くの訓練サンプルが必要か?【JST・京大機械翻訳】

Do We Need More Training Samples For Text Classification?

出版者サイト複写サービスで全文入手
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=20A1997370&from=J-GLOBAL&jstjournalNo=D0698C") }}

著者 (2件)： ,
資料名：
号： AICCC ’18 ページ： 121-128 発行年： 2018年
JST資料番号： D0698C 資料種別：会議録 (C)
記事区分：原著論文発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

近年,例外的なクラウドコンピューティング技術の上昇に伴い,複雑な問題を解決するための機械学習手法が大いに加速された。テキスト分類の分野では,機械学習は,明示的にラベル付けせずにタスクを学習し予測する能力を提供する技術であり,機械を学習するために十分なデータが必要であると言われている。しかしながら,より多くのデータは機械学習アルゴリズムにおける過剰適合を引き起こす傾向があり,そして,多くのサンプルが望ましいレベルの性能を達成するために必要な方法を決定する際に,対象基準はない。本論文では,特徴選択法を用いてこの問題を検討した。著者らの実験において,特徴選択は訓練データセットの必要なサイズの最大で66.67%減少できることを証明した。一方,分類器の性能測度としてのカッパ係数は,最大値で11ポイントを増加させることができた。さらに,無関係な特徴を除去する技術としての特徴選択は,過度に過剰適合を防ぐことができることがわかった。Please refer to this article’s citation page on the publisher website for specific rights information. Translated from English into Japanese by JST.【JST・京大機械翻訳】

, ,
, , , 【Automatic Indexing@JST】

著者キーワード (3件)： , ,

人工知能

, ,

前のページに戻る