特許
J-GLOBAL ID:200903023881640568

決定木生成方法およびモデル構造生成装置

発明者:
出願人/特許権者:
代理人 (1件): 森田 雄一
公報種別:公開公報
出願番号(国際出願番号):特願2002-323610
公開番号(公開出願番号):特開2004-157814
出願日: 2002年11月07日
公開日(公表日): 2004年06月03日
要約:
【課題】モデル構造の決定や変更を容易にするため、連続数値属性にある学習データをデータ分布特徴に基づいて決定木により分類する決定木生成方法及びこの決定木生成方法によるモデル構造生成装置を提供する。【解決手段】親ノードに含まれる学習データのある説明変数(図では属性3をデータとする説明変数)に着目し、所定条件で複数(図では3個)の学習データに分岐し、これら学習データを含む分岐後ノードを複数生成する。そして、この分岐後ノードの目的変数に係るデータ(図では属性1のデータ)を用いて二個の分岐後ノードのそれぞれの学習データが統計的に有意な差がある判断し、有意な差ががない場合には分岐後ノードをグループ化する。このような判断を繰り返して統計的に有意な差がある複数ノードに分岐した決定木を生成する決定木生成方法とした。また、この決定木によりモデル構造を生成するモデル構造生成装置とした。【選択図】 図7
請求項(抜粋):
複数属性のデータ群からなる学習データを親のノードに含み、ある一の属性に係るデータ群を連続数値属性の目的変数とし、また、残りの複数属性に係るデータ群をそれぞれ説明変数とする場合に、これら目的変数と説明変数との関係が所定の分類規則を満たすようなノードを複数生成して木構造に分岐させる決定木生成方法であって、 一の説明変数についてノードの分岐を決定するノード決定ステップは、 一の説明変数に係るデータ群を所定条件で分割して複数の分岐後ノードを生成する分岐後ノード生成ステップと、 一の分岐後ノードに含まれる学習データについての基礎統計量を全ての分岐後ノードに関して算出する初期統計量算出ステップと、 全ての分岐後ノードの中から二個の分岐後ノードを選択する分岐後ノード選択ステップと、 二個の分岐後ノードに含まれる学習データの統計検定量に統計的に有意な差がない場合は二個の分岐後ノードはグループ化可能と判断し、また、統計検定量に統計的に有意な差がある場合は二個の分岐後ノードはグループ化不可能と判断するグループ化可能判断ステップと、 グループ化が可能な二個の分岐後ノードをグループ化して一個の分岐後ノードを生成するグループ化ステップと、 グループ化した分岐後ノードに含まれる学習データの基礎統計量を算出するグループ化ノード統計量算出ステップと、 残る分岐後ノードがグループ化が可能か否かを判断し、これ以上のグループ化が不可能になるまで、分岐後ノード生成ステップ、初期統計量算出ステップ、分岐後ノード選択ステップ、グループ化可能判断ステップ、グループ化ステップ、およびグループ化ノード統計量算出ステップを繰り返すようにするグループ化継続判断ステップと、 グループ化が不可能な場合に残った分岐後ノードをノードとして確定するノード確定ステップと、 を行い、 親ノードから分岐する複数ノードにそれぞれ含まれる学習データ間で統計的に有意な差があるという分類規則を満たすような決定木を生成することを特徴とする決定木生成方法。
IPC (3件):
G06N5/04 ,  G06F17/30 ,  G06N3/00
FI (5件):
G06N5/04 580A ,  G06N5/04 550C ,  G06F17/30 220Z ,  G06F17/30 419A ,  G06N3/00 560A
Fターム (2件):
5B075NS10 ,  5B075UU40
引用特許:
出願人引用 (2件) 審査官引用 (2件)
引用文献:
出願人引用 (1件)
  • CORE - a system that predicts continuous variables
審査官引用 (1件)
  • CORE - a system that predicts continuous variables

前のページに戻る