抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
我々はApache Hive上で動作する機械学習ライブラリHivemallをオープンソースソフトウェアとして公開している。Hivemallはオープンソースの機械学習フレームワークとしてデータ量に対するスケーラビリティが最も高いものの1つであり,Hadoop Distributed Filesystem(HDFS)に格納されたデータを入力とした機械学習処理を効率的に扱えるという特徴からHadoop/Hiveに精通する開発者やデータ分析の専門家から注目を集めている。本稿では,Hivemallによるスケーラブルな機械学習を実現するうえで得られた実践的な知見,およびその実現手法を述べる。KDD Cup 2012,Track2の広告クリックスルー率の予測タスクを用いた評価実験により,学習速度に定評のあるState-of-the-artの機械学習フレームワークに対してHivemallがより短い学習時間で同等以上の予測精度を出せることを示し,さらに計算ノードの追加によって学習時間を短縮できることを示す。(著者抄録)