特許
J-GLOBAL ID:201203047867218316
データ分析支援装置およびプログラム
発明者:
,
出願人/特許権者:
,
代理人 (17件):
蔵田 昌俊
, 高倉 成男
, 河野 哲
, 中村 誠
, 福原 淑弘
, 峰 隆司
, 白根 俊郎
, 村松 貞男
, 野河 信久
, 幸長 保次郎
, 河野 直樹
, 砂川 克
, 井関 守三
, 佐藤 立志
, 岡田 貴志
, 堀内 美保子
, 竹内 将訓
公報種別:公開公報
出願番号(国際出願番号):特願2011-042687
公開番号(公開出願番号):特開2012-181605
出願日: 2011年02月28日
公開日(公表日): 2012年09月20日
要約:
【課題】任意のデータテーブル間において適切な属性の対応づけを行うことが可能なデータ分析支援装置およびプログラムを提供することにある。【解決手段】第1の単語抽出手段は、第1のデータテーブルを構成する第1の文字列型属性が有する属性値から第1の単語を抽出する。第2の単語抽出手段は、第2のデータテーブルを構成する第2の文字列型属性が有する属性値から第2の単語を抽出する。類似度算出手段は、第1の抽出手段によって抽出された第1の単語および第2の抽出手段によって抽出された第2の単語に基づいて、第1のデータテーブルを構成する第1の文字列型属性および第2のデータテーブルを構成する第2の文字列型属性の類似度を算出する。類似属性候補抽出手段は、類似度算出手段によって算出された類似度に基づいて、第1の文字列型属性および第2の文字列型属性を類似属性候補として抽出する。【選択図】図2
請求項(抜粋):
文字列を含む属性値を有する第1の文字列型属性を含む第1の属性から構成される第1のデータテーブルおよび文字列を含む属性値を有する第2の文字列型属性を含む第2の属性から構成される第2のデータテーブルを予め格納するデータテーブル格納手段と、
前記データテーブル格納手段に格納されている第1のデータテーブルを構成する第1の属性に含まれる第1の文字列型属性が有する属性値に含まれる文字列を構成する第1の単語を抽出する第1の単語抽出手段と、
前記データテーブル格納手段に格納されている第2のデータテーブルを構成する第2の属性に含まれる第2の文字列型属性が有する属性値に含まれる文字列を構成する第2の単語を抽出する第2の単語抽出手段と、
前記第1の抽出手段によって抽出された第1の単語および前記第2の抽出手段によって抽出された第2の単語に基づいて、前記第1のデータテーブルを構成する第1の属性に含まれる第1の文字列型属性および前記第2のデータテーブルを構成する第2の属性に含まれる第2の文字列型属性の類似度を算出する類似度算出手段と、
前記算出された類似度に基づいて、前記第1のデータテーブルを構成する第1の属性に含まれる第1の文字列型属性および前記第2のデータテーブルを構成する第2の属性に含まれる第2の文字列型属性を類似属性候補として抽出する類似属性候補抽出手段と
を具備することを特徴とするデータ分析支援装置。
IPC (2件):
FI (5件):
G06F17/30 240C
, G06F17/30 350C
, G06F17/30 170A
, G06F17/30 210Z
, G06F17/60 218
Fターム (6件):
5B075ND03
, 5B075NK04
, 5B075NK54
, 5B075NR05
, 5B075QM08
, 5B075UU40
引用特許: