आयाम एक संरचना है जो जानकारी के संग्रह को वर्गीकृत करती है ताकि उस जानकारी से संबंधित प्रश्नों के सार्थक उत्तर प्राप्त किए जा सकें। डेटा प्रबंधन और डेटा वेयरहाउस में आयामों में अपेक्षाकृत स्थिर डेटा होता है; हालाँकि, यह आयामी डेटा समय के साथ और अप्रत्याशित अंतराल पर धीरे-धीरे बदल सकता है। इस प्रकार के डायमेंशनल डेटा को स्लोली चेंजिंग डाइमेंशन (SCD) के रूप में जाना जाता है।
डेटा वेयरहाउस वातावरण में, एक आयाम तालिका में एक प्राथमिक कुंजी होती है जो प्रत्येक रिकॉर्ड और जानकारी के अन्य टुकड़ों की विशिष्ट रूप से पहचान करती है जिन्हें आयामी डेटा के रूप में जाना जाता है। प्राथमिक कुंजी इस कुंजी का उपयोग करके एक तथ्य तालिका से लिंक होगी। इसलिए, वर्तमान डेटा और ऐतिहासिक डेटा को अद्यतन और संभालने के लिए एक मॉडल होना महत्वपूर्ण है। ऐसे मान्यता प्राप्त मॉडल हैं जिन्हें उनके प्रकारों से जाना जाता है:
- टाइप 1 - इस मॉडल में पुराने वर्तमान मान को नए वर्तमान मान के साथ अधिलेखित करना शामिल है। कोई इतिहास नहीं रखा गया है।
- टाइप 2 - वर्तमान और ऐतिहासिक रिकॉर्ड एक ही फाइल या टेबल में रखे और बनाए जाते हैं।
- टाइप 3 - वर्तमान डेटा और ऐतिहासिक डेटा को एक ही रिकॉर्ड में रखा जाता है। उपयोगकर्ता तय करता है कि रिकॉर्ड में कितना इतिहास रखा गया है।
- टाइप 4 - इस मॉडल में, वर्तमान डेटा को दो अलग-अलग तालिकाओं में बनाए रखा जाता है; एक वर्तमान डेटा के लिए और एक जिसमें सभी ऐतिहासिक डेटा शामिल हैं।
- टाइप 6 - यह मॉडल टाइप 1, टाइप 2 और टाइप 3 का हाइब्रिड है।
विभिन्न SCD मॉडलों के लिए सभी अद्यतन विधियों को IRI CoSort या IRI Voracity में SortCL प्रोग्राम का उपयोग करके पूरा किया जा सकता है। Voracy अब इन प्रोग्रामों को स्वचालित रूप से बनाने के लिए एक एकल एंड-टू-एंड जॉब क्रिएशन विजार्ड भी प्रदान करता है; नीचे देखें। अधिकांश प्रकार प्रत्येक से एक अद्वितीय कुंजी की बराबरी करने के आधार पर अद्यतन स्रोत में रिकॉर्ड के साथ मास्टर डेटा स्रोत के रिकॉर्ड से मिलान करने के लिए एक पूर्ण बाहरी जुड़ाव का उपयोग करते हैं। मैचों के साथ रिकॉर्ड को मास्टर में अद्यतन करने की आवश्यकता है। अद्यतन स्रोत में ऐसे रिकॉर्ड जिनका मिलान नहीं है, उन्हें मास्टर में जोड़ने की आवश्यकता है।
विभिन्न एससीडी प्रकारों पर मेरे लेख फाइलों में स्रोत या इनपुट डेटा दिखाते हैं और सॉर्टसीएल स्क्रिप्ट दिखाते हैं जिनका उपयोग मास्टर फाइलों को अपडेट करने के लिए किया जाता है। इन लिपियों के साथ तालिकाएँ भी एक स्रोत हो सकती हैं।
प्रत्येक उदाहरण में, मैं एक आयामी स्रोत को अद्यतन करने के लिए चरणों को कवर करता हूं जो उत्पाद लागतों को बनाए रखता है जो अनियमित अंतराल पर बदलते हैं। मुख्य फ़ील्ड या कॉलम उत्पादकोड है। सभी स्रोत मास्टर फाइलों में निम्नलिखित डेटा होगा:
Master1.dat स्रोत में शामिल हैं:
ProductCode | लागत | StartDate |
---|---|---|
C123 | 125.50 | 20110228 |
F112 | 2365.00 | 20120101 |
G101 | 19.25 | 20110930 |
J245 | 450.50 | 20110430 |
S022 | 98.75 | 20110515 |
अद्यतन डेटा में सभी समान StartDate होंगे। अद्यतन स्रोत में निम्न डेटा शामिल है:
ProductCode | लागत | StartDate |
---|---|---|
F112 | 2425.00 | 20120701 |
J245 | 550.50 | 20120701 |
M447 | 101.75 | 20120701 |
S022 | 101.75 | 20120701 |
यहां आईआरआई वेब साइट पर एससीडी रिपोर्टिंग पर भी चर्चा की गई है। एससीडी के लिए विशिष्ट ये लेख देखें:टाइप 1, टाइप 2, टाइप 3, टाइप 4 और टाइप 6।
नया SCD ग्राफ़िकल विज़ार्ड
Voracity उपयोगकर्ता अब ग्रहण पर निर्मित IRI कार्यक्षेत्र GUI में SCD प्रकार 1, 2, 3, 4 और 6 पर रिपोर्ट करने के लिए एक उद्देश्य-निर्मित जॉब क्रिएशन विज़ार्ड का उपयोग कर सकते हैं। विज़ार्ड सॉर्टिंग, एक्सप्रेशन मूल्यांकन, एग्रीगेशन, नई फ़ॉर्मेटिंग, एन्क्रिप्टिंग, और बहुत कुछ के एकीकरण का भी समर्थन करता है।
कार्य सेट करने और विज़ार्ड में SCD प्रकार का चयन करने के बाद, आप मास्टर डेटा और अद्यतन जानकारी निर्दिष्ट करते हैं। उसके बाद, आप लक्ष्य के लिए मैपिंग निर्दिष्ट करते हैं, फ़ील्ड्स को मिलान किए गए स्रोत फ़ील्ड के अनुरूप रखते हैं, और आवश्यकतानुसार कॉम्बो बॉक्स का उपयोग करते हुए, वर्तमान और ऐतिहासिक फ़ील्ड सेट के साथ काम करते हैं। जॉइन सोर्स पेज पर निर्दिष्ट जानकारी में शामिल होने के बाद, उपयुक्त स्क्रिप्ट बनाई जाती है और आरेख, निष्पादित, संशोधित या साझा करने के लिए तैयार होती है।
ऊपर दिए गए प्रकारों से जुड़े लेखों को यह दर्शाने के लिए अपडेट किया जाएगा कि कैसे Voracity में नया SCD विज़ार्ड आपके लिए इन नौकरियों को स्वतः बना सकता है।