抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
決定森林アルゴリズムは,あらゆるノードが特徴空間を2つの部分領域に分割して,結果として左または右枝に用例を送るように,再帰的にバイナリツリー構造を学習することによって,データをモデル化する。軸整列決定森林において,入力用例を経路する「決定」は,特徴空間における単一次元に関する条件の評価の結果であった。そのような条件は,局所損失関数を最適化する効率的,しばしば greedy欲なアルゴリズムを用いて学習される。例えば,ノード条件は数値特徴に適用される閾値関数であり,そのパラメータはノードで利用可能な値のセットを掃引し,純度のいくつかの測度を最大化する閾値を選択することにより学習される。明らかに,特徴タイプに対する条件を学習し評価するためのアルゴリズムが存在するかどうかは,決定森林アルゴリズムが特徴タイプをすべてモデル化できるかどうかを決定する。例えば,今日の意思決定森林は,テキスト特徴を直接消費できないが,代わりに,そのような特徴を,代わりに要約統計量に変換しなければならない。本研究では,ギャップを橋渡しする。カテゴリー変数の非順序集合として定義されるカテゴリー集合特徴に特異的である条件を定義し,それを学習するためのアルゴリズムを提示し,それにより,逐次順序を保存せずに,テキストを直接モデル化する能力を有する決定森林を編集した。著者らのアルゴリズムは訓練中に効率的であり,得られた条件はQuickScorer推論アルゴリズムの拡張で評価するのに高速である。ベンチマークテキスト分類データセットに関する実験は,著者らの提案の有用性と有効性を実証した。【JST・京大機械翻訳】