特許
J-GLOBAL ID:200903029020070238

データクリーニング処理方法および装置とデータクリーニング処理プログラムを記録した記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 三好 秀和 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平10-037750
公開番号(公開出願番号):特開平11-238006
出願日: 1998年02月19日
公開日(公表日): 1999年08月31日
要約:
【要約】【課題】 アプリケーションプログラムの個別作成や人手による目視確認処理を必要とせずに、表現形式が均一でないデータが格納されたファイルから不整合データを除去して統合レコードを効率的に作成するデータクリーニング処理方法および装置とデータクリーニング処理プログラムを記録した記録媒体を提供する。【解決手段】 レコード統一化処理部1でレコード統一化定義4に従いレコードの各データ項目に対して統一表現形式のデータ項目の統一化レコードを作成し、レコード統合処理部2でレコード統合定義5に従い統一化レコード群に対して同一データ項目値を有する統一化レコードを統合した統合レコードを作成し、データ項目間制約条件チェック処理部3でデータ項目間制約条件チェック定義6に従い統合レコードのデータ項目間制約条件をチェックし、その結果を表示するデータ項目を付加したデータ項目間制約条件チェック結果レコードを作成する。
請求項(抜粋):
データ値の表現形式が均一でないデータが格納された入力ファイルから、複数のレコードを突合し、不整合データを除去して統合レコードを作成するデータクリーニング処理方法であって、レコードのデータ表現形式の統一方法を記述するレコード統一化定義、複数のレコードの統合方法を記述するレコード統合定義、およびレコード内のデータ項目間制約条件のチェック方法を記述するデータ項目間制約条件チェック定義を設け、データ項目毎のデータ表現形式を統一化する標準データ統一化部品群、および該標準データ統一化部品群以外にユーザが指定する統一化を可能とする個別データ統一化部品群を定義しておき、前記レコード統一化定義に従い、入力ファイルに格納された1つ以上のレコードの各データ項目に対して前記標準データ統一部品群および個別データ統一化部品群を使用し、統一表現形式のデータ項目を作成し、各レコード中に付加して統一化レコードを作成するレコード統一化処理を行い、前記レコード統合定義に従い、レコード統一化処理結果である統一化レコード群に対して、同一データ項目値を有する統一化レコードを統合した統合レコードおよび同一データ項目値を持たない統一化レコードである非統合レコードをそれぞれ別ファイルに出力するレコード統合処理を行い、前記データ項目間制約条件チェック定義に従い、レコード統合処理結果である統合レコード内のデータ項目間制約条件をチェックし、その結果を表示するデータ項目を付加したデータ項目間制約条件チェック結果レコードを作成し、チェック結果を表示するデータ項目値に従い、データ項目間制約条件チェック結果レコードを別ファイルに出力するデータ項目間制約条件チェック処理を行うことを特徴とするデータクリーニング処理方法。
IPC (2件):
G06F 12/00 513 ,  G06F 17/30
FI (3件):
G06F 12/00 513 A ,  G06F 15/40 350 D ,  G06F 15/401 340 C

前のページに戻る