特許
J-GLOBAL ID:201603018294737569
データ分類方法、データ分類プログラム、及び、データ分類装置
発明者:
出願人/特許権者:
代理人 (2件):
土井 健二
, 林 恒徳
公報種別:公開公報
出願番号(国際出願番号):特願2014-140254
公開番号(公開出願番号):特開2016-018358
出願日: 2014年07月08日
公開日(公表日): 2016年02月01日
要約:
【課題】教師データと分析するデータの分布が異なっている場合でも、良好な分類規則を生成し、より正確な分析を行うデータ分類方法、データ分類プログラム、及び、データ分類装置を提供する。【解決手段】分類の対象とする複数のデータを、前記データに含まれる特徴量に基づいて複数の分類項目に分類する方法であって、プロセッサが、前記データの前記複数の分類項目の第1の比率と、複数の教師データの前記複数の分類項目の第2の比率と、前記複数の教師データの前記分類項目それぞれにおける前記特徴量を含む前記教師データの割合とに基づいて、前記特徴量を含む教師データが前記データの分布の前記分類項目に出現する出現確率を算出する算出工程と、プロセッサが、前記出現確率に基づいた前記特徴量を有する前記複数の教師データに基づいて、前記特徴量及び当該特徴量の重みを有する規則を生成する生成工程と、プロセッサが、前記分類の対象とする複数のデータを、前記生成した規則に基づいて分類する分類工程と、を有する。【選択図】図8
請求項(抜粋):
分類の対象とする複数のデータを、前記データに含まれる特徴量に基づいて複数の分類項目に分類する方法であって、
プロセッサが、前記データの前記複数の分類項目の第1の比率と、複数の教師データの前記複数の分類項目の第2の比率と、前記複数の教師データの前記分類項目それぞれにおける前記特徴量を含む前記教師データの割合とに基づいて、前記特徴量を含む教師データが前記データの分布の前記分類項目に出現する出現確率を算出する算出工程と、
プロセッサが、前記出現確率に基づいた前記特徴量を有する前記複数の教師データに基づいて、前記特徴量及び当該特徴量の重みを有する規則を生成する生成工程と、
プロセッサが、前記分類の対象とする複数のデータを、前記生成した規則に基づいて分類する分類工程と、を有するデータ分類方法。
IPC (3件):
G06F 17/30
, G06N 5/04
, G06N 3/00
FI (3件):
G06F17/30 210D
, G06N5/04 550J
, G06N3/00 560A
引用特許:
前のページに戻る