特許
J-GLOBAL ID:201503043244594143

数値データ解析装置及びプログラム

発明者:
出願人/特許権者:
代理人 (3件): 阪本 清孝 ,  田中 香樹 ,  田邉 壽二
公報種別:公開公報
出願番号(国際出願番号):特願2013-159323
公開番号(公開出願番号):特開2015-032013
出願日: 2013年07月31日
公開日(公表日): 2015年02月16日
要約:
【課題】医療データ等のやや特殊な統計的な数値データを、その分布の種類に応じて適切に離散化する。また、離散化された結果により、連続的な数値データに対しても潜在的ディリクレ配分法を適用可能とする。【解決手段】分布特定部2は、各サンプルでの数値を集計した項目データを、正規分布からのずれ評価により、正規分布、対数正規分布、対数正規+パレートの混合分布のいずれであるか特定する。データ離散化部3は、特定された分布の型に応じて、各項目データを離散化する。推定部4は、離散化された区間に数値ラベルを付与し、各サンプルの項目データにおいて当該ラベルに基づく文書を生成し、全サンプルに渡る文書集合に潜在的ディリクレ配分法を適用することで、当初の連続的な数値データに対する解析結果を得る。【選択図】図1
請求項(抜粋):
所定の項目について各サンプルでの数値を集計した項目データを取得して、各項目データの分布の型を特定する分布特定部と、 前記特定された型に応じて、各項目データにおける一連の数値を区間分けすることにより離散化するデータ離散化部と、を備え、 前記分布特定部は、各項目データに正規分布をあてはめた際のずれを評価することにより、各項目データの分布の型を、正規分布と、対数正規分布と、対数正規分布及びパレート分布の混合分布と、のいずれかとして特定することを特徴とする数値データ解析装置。
IPC (1件):
G06F 17/30
FI (1件):
G06F17/30 220Z
引用特許:
出願人引用 (4件)
全件表示

前のページに戻る