抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
多くのテキストマイニングツールは,Webページに関する利用可能な文書には直接適用できない。テキストデータのフェッチと前処理のためのツールであるが,1作業ツールチェーンの中でそれらを組み合わせる時間がかかることがある。文書は様々な貯蔵フォーマットを持つ複数の遠隔発生源に位置しているかどうかを前処理タスクはさらに大きな労働力を要する。本論文では,データは,広範囲のWebリソースのに由来する場合のデータ作成プロセスの簡素化を提案した。オープンソースツール,Kayurと呼ばれるルーチンデータ前処理段階に必要な時間と労力を最小化することを開発し,データ解析の主なタスクに進む迅速に可能にした。ツールにより生成されたデータセットはデータマイニングワークベンチ,WEKAまたはCarrot2などに負荷分類,特徴予測,及び他のデータマイニングタスクを行うことが可能になる。Copyright 2017 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】