Database
 sql >> डेटाबेस >  >> RDS >> Database

धीरे-धीरे बदलते आयामों का परिचय (एससीडी)

आयाम एक संरचना है जो जानकारी के संग्रह को वर्गीकृत करती है ताकि उस जानकारी से संबंधित प्रश्नों के सार्थक उत्तर प्राप्त किए जा सकें। डेटा प्रबंधन और डेटा वेयरहाउस में आयामों में अपेक्षाकृत स्थिर डेटा होता है; हालाँकि, यह आयामी डेटा समय के साथ और अप्रत्याशित अंतराल पर धीरे-धीरे बदल सकता है। इस प्रकार के डायमेंशनल डेटा को स्लोली चेंजिंग डाइमेंशन (SCD) के रूप में जाना जाता है।

डेटा वेयरहाउस वातावरण में, एक आयाम तालिका में एक प्राथमिक कुंजी होती है जो प्रत्येक रिकॉर्ड और जानकारी के अन्य टुकड़ों की विशिष्ट रूप से पहचान करती है जिन्हें आयामी डेटा के रूप में जाना जाता है। प्राथमिक कुंजी इस कुंजी का उपयोग करके एक तथ्य तालिका से लिंक होगी। इसलिए, वर्तमान डेटा और ऐतिहासिक डेटा को अद्यतन और संभालने के लिए एक मॉडल होना महत्वपूर्ण है। ऐसे मान्यता प्राप्त मॉडल हैं जिन्हें उनके प्रकारों से जाना जाता है:

  • टाइप 1 - इस मॉडल में पुराने वर्तमान मान को नए वर्तमान मान के साथ अधिलेखित करना शामिल है। कोई इतिहास नहीं रखा गया है।
  • टाइप 2 - वर्तमान और ऐतिहासिक रिकॉर्ड एक ही फाइल या टेबल में रखे और बनाए जाते हैं।
  • टाइप 3 - वर्तमान डेटा और ऐतिहासिक डेटा को एक ही रिकॉर्ड में रखा जाता है। उपयोगकर्ता तय करता है कि रिकॉर्ड में कितना इतिहास रखा गया है।
  • टाइप 4 - इस मॉडल में, वर्तमान डेटा को दो अलग-अलग तालिकाओं में बनाए रखा जाता है; एक वर्तमान डेटा के लिए और एक जिसमें सभी ऐतिहासिक डेटा शामिल हैं।
  • टाइप 6 - यह मॉडल टाइप 1, टाइप 2 और टाइप 3 का हाइब्रिड है।

विभिन्न SCD मॉडलों के लिए सभी अद्यतन विधियों को IRI CoSort या IRI Voracity में SortCL प्रोग्राम का उपयोग करके पूरा किया जा सकता है। Voracy अब इन प्रोग्रामों को स्वचालित रूप से बनाने के लिए एक एकल एंड-टू-एंड जॉब क्रिएशन विजार्ड भी प्रदान करता है; नीचे देखें। अधिकांश प्रकार प्रत्येक से एक अद्वितीय कुंजी की बराबरी करने के आधार पर अद्यतन स्रोत में रिकॉर्ड के साथ मास्टर डेटा स्रोत के रिकॉर्ड से मिलान करने के लिए एक पूर्ण बाहरी जुड़ाव का उपयोग करते हैं। मैचों के साथ रिकॉर्ड को मास्टर में अद्यतन करने की आवश्यकता है। अद्यतन स्रोत में ऐसे रिकॉर्ड जिनका मिलान नहीं है, उन्हें मास्टर में जोड़ने की आवश्यकता है।

विभिन्न एससीडी प्रकारों पर मेरे लेख फाइलों में स्रोत या इनपुट डेटा दिखाते हैं और सॉर्टसीएल स्क्रिप्ट दिखाते हैं जिनका उपयोग मास्टर फाइलों को अपडेट करने के लिए किया जाता है। इन लिपियों के साथ तालिकाएँ भी एक स्रोत हो सकती हैं।

प्रत्येक उदाहरण में, मैं एक आयामी स्रोत को अद्यतन करने के लिए चरणों को कवर करता हूं जो उत्पाद लागतों को बनाए रखता है जो अनियमित अंतराल पर बदलते हैं। मुख्य फ़ील्ड या कॉलम उत्पादकोड है। सभी स्रोत मास्टर फाइलों में निम्नलिखित डेटा होगा:

Master1.dat स्रोत में शामिल हैं:

ProductCode लागत StartDate
C123 125.50 20110228
F112 2365.00 20120101
G101 19.25 20110930
J245 450.50 20110430
S022 98.75 20110515

अद्यतन डेटा में सभी समान StartDate होंगे। अद्यतन स्रोत में निम्न डेटा शामिल है:

ProductCode लागत StartDate
F112 2425.00 20120701
J245 550.50 20120701
M447 101.75 20120701
S022 101.75 20120701

यहां आईआरआई वेब साइट पर एससीडी रिपोर्टिंग पर भी चर्चा की गई है। एससीडी के लिए विशिष्ट ये लेख देखें:टाइप 1, टाइप 2, टाइप 3, टाइप 4 और टाइप 6।

नया SCD ग्राफ़िकल विज़ार्ड

Voracity उपयोगकर्ता अब ग्रहण पर निर्मित IRI कार्यक्षेत्र GUI में SCD प्रकार 1, 2, 3, 4 और 6 पर रिपोर्ट करने के लिए एक उद्देश्य-निर्मित जॉब क्रिएशन विज़ार्ड का उपयोग कर सकते हैं। विज़ार्ड सॉर्टिंग, एक्सप्रेशन मूल्यांकन, एग्रीगेशन, नई फ़ॉर्मेटिंग, एन्क्रिप्टिंग, और बहुत कुछ के एकीकरण का भी समर्थन करता है।

कार्य सेट करने और विज़ार्ड में SCD प्रकार का चयन करने के बाद, आप मास्टर डेटा और अद्यतन जानकारी निर्दिष्ट करते हैं। उसके बाद, आप लक्ष्य के लिए मैपिंग निर्दिष्ट करते हैं, फ़ील्ड्स को मिलान किए गए स्रोत फ़ील्ड के अनुरूप रखते हैं, और आवश्यकतानुसार कॉम्बो बॉक्स का उपयोग करते हुए, वर्तमान और ऐतिहासिक फ़ील्ड सेट के साथ काम करते हैं। जॉइन सोर्स पेज पर निर्दिष्ट जानकारी में शामिल होने के बाद, उपयुक्त स्क्रिप्ट बनाई जाती है और आरेख, निष्पादित, संशोधित या साझा करने के लिए तैयार होती है।

ऊपर दिए गए प्रकारों से जुड़े लेखों को यह दर्शाने के लिए अपडेट किया जाएगा कि कैसे Voracity में नया SCD विज़ार्ड आपके लिए इन नौकरियों को स्वतः बना सकता है।


  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. टी-एसक्यूएल मंगलवार #65 :कुछ नया सिखाएं

  2. एसक्यूएल का उपयोग करके अपवादों के साथ क्लॉज द्वारा ऑर्डर कैसे लिखें

  3. SQL में स्कीमा क्या है और इसे कैसे बनाया जाता है?

  4. पंक्तियों में अधिकतम मान कैसे खोजें

  5. एक समान क्वेरी के लिए एकाधिक योजनाएं