IRI सॉफ़्टवेयर उत्पादों के नाम और वे कैसे चलते हैं, कभी-कभी अज्ञात लोगों के लिए रहस्य, या यहाँ तक कि भ्रम का स्रोत रहे हैं। यह लेख संभावित उपयोगकर्ताओं, भागीदारों और नए उद्योग विश्लेषण के लिए एक त्वरित प्राइमर प्रदान करते हुए, टुकड़ों की व्याख्या करता है और उनके परस्पर क्रिया को स्पष्ट करता है एसटी।
यह सब कहां से शुरू हुआ
इसकी शुरुआत 1978 में IRI CoSort के साथ हुई थी, यूनिक्स और विंडोज के लिए बड़ा डेटा सॉर्टिंग, ट्रांसफॉर्मेशन और रिपोर्टिंग यूटिलिटी आज भी व्यापक रूप से उपयोग में है। CoSort से पहले, इस पहले IRI उत्पाद को उसी क्रम में CO-SORT, COSORT, और CoSORT कहा जाता था।
1992 में, IRI ने CoSort पैकेज में अन्य उपयोगिताओं और API में सॉर्ट कंट्रोल लैंग्वेज (SortCL) डेटा डेफिनिशन सिंटैक्स और मैनिपुलेशन प्रोग्राम को जोड़ा। आज, CoSort पैकेज में SortCL सबसे व्यापक रूप से उपयोग किया जाने वाला और फ़ीचर-पैक UI है।
SortCL स्क्रिप्ट परिभाषित करती है, और Sortcl प्रोग्राम चलता है, ऐसे कार्य जो कई सामान्य डेटा मूवमेंट और मैपिंग कार्यों को निष्पादित और संयोजित करते हैं जिन्हें CoSort उपयोगकर्ताओं को चलाने की आवश्यकता होती है। SortCL न केवल सीखने, पढ़ने और संशोधित करने के लिए एक सरल 4GL है, बल्कि यह एक API (जिसे Sortcl_routine कहा जाता है) के माध्यम से भी समर्थित है, और ग्रहण पर निर्मित मुफ़्त IRI कार्यक्षेत्र IDE में ग्राफिक रूप से समर्थित है।
जैसे ही SortCL कार्यक्षमता का विस्तार हुआ, इसने सॉर्ट माइग्रेशन और BI/DW त्वरण के लिए पारंपरिक CoSort बाज़ार को पछाड़ दिया। आज, SortCL निष्पादन योग्य न केवल अधिकांश CoSort नौकरियों को चलाने वाला इंजन है, बल्कि यह कई स्पिन-ऑफ उत्पादों का धड़कता हुआ दिल है, जिसे यहां दिखाया गया है:
CoSort / SortCL स्पिन-ऑफ उत्पाद
विशेष रूप से, समान SortCL इंजन और संगत जॉब स्क्रिप्ट - आमतौर पर IRI कार्यक्षेत्र से डिज़ाइन और प्रबंधित की जाती हैं, संरचित डेटा स्रोतों को इसमें संसाधित करती हैं:
- डेटा मास्किंग के लिए IRI फ़ील्डशील्ड और IRI डार्कशील्ड
- परीक्षण डेटा संश्लेषण और डेटाबेस सब्मिटिंग के लिए IRI RowGen
- डेटा और डेटाबेस रूपांतरण और प्रतिकृति के लिए IRI NextForm और,
- IRI Voracity डेटा प्रबंधन प्लेटफ़ॉर्म नौकरियां, जिनमें CoSort और शामिल हैं ऊपर लिंक किए गए उत्पाद, प्लस सामान्य कार्यक्षेत्र GUI के माध्यम से अतिरिक्त फ्रंट-एंड क्षमताएं, जैसे:
- डेटा खोज (प्रोफ़ाइल, वर्गीकरण और खोज)
- डेटा वेयरहाउस ETL, CDC, और SDC
- डेटा वॉल्ट 2.0 माइग्रेशन और प्रोटोटाइपिंग
- डेटा गुणवत्ता (सत्यापन, सफाई, समरूपीकरण)
- स्प्लंक और KNIME, और हैंडऑफ़ के माध्यम से अन्य BI टूल के लिए विश्लेषण या डेटा तकरार
उत्पाद पदानुक्रम को देखने का दूसरा तरीका इस प्रकार है:
जहां वर्कबेंच आईडीई है जहां सभी आईआरआई उत्पाद नौकरियां डिज़ाइन की गई हैं - जिसमें वोरासिटी में समर्थित अतिरिक्त सुविधाएं शामिल हैं।
अक्सर पूछे जाने वाले प्रश्न
चूंकि SortCL CoSort के साथ शुरू हुआ है, और इन सभी उत्पादों के लिए सामान्य है, क्या इसका मतलब यह है कि मैं CoSort या उपरोक्त किसी अन्य उत्पाद का उपयोग कर सकता हूं जो अन्य उत्पाद भी करते हैं?
जवाब हां और नहीं है। हां, आपके पास SortCL है, और सिद्धांत रूप में कुछ वही काम कर सकते हैं जो एक और SortCL- संगत IRI उत्पाद प्रदर्शन करने के लिए है। लेकिन यह अधिक कठिन होगा और उत्पादन जोखिम का प्रतिनिधित्व करता है। IRI केवल आपके लाइसेंस प्राप्त IRI उत्पाद (उत्पादों) से जुड़े सर्वोत्तम कार्यों के लिए दस्तावेज़ीकरण और सहायता प्रदान करता है।
इसलिए, व्यवहार में क्रॉसओवर क्षमता सीमित है। फिर भी, कई मामलों में (जैसे सॉर्ट किए गए DB सबसेट की तरह) कॉम्बिनेटरी कार्यक्षमता आम है, और वोरासिटी में, बहु-कार्य, बहु-चरणीय उपयोग के मामले (जैसे वृद्धिशील मैपिंग, मास्किंग, क्लींजिंग और रिफॉर्मेटिंग) अत्यधिक कुशल और पूरी तरह से समर्थित हैं।पी>
SortCL सभी IRI Voracity CDC, ETL, CDC, क्लींजिंग, सुलह, सब्मिटिंग में डिफ़ॉल्ट इंजन है ,
PII मास्किंग, परीक्षण डेटा संश्लेषण, रूपांतरण, पुन:स्वरूपण, तकरार, विश्लेषण, और रिपोर्टिंग कार्य।
रनटाइम आर्किटेक्चर
अब जब आप उत्पादों के नाम जानते हैं, तो आइए जानें कि वे कैसे परस्पर संबंध रखते हैं और कैसे लागू होते हैं।
आईआरआई सॉफ्टवेयर आमतौर पर क्लाइंट/सर्वर मॉडल में संचालित होता है, जहां सॉर्टसीएल-संगत नौकरियों को आईआरआई वर्कबेंच या अन्य टेक्स्ट एडिटर जैसे फ्रंट-एंड संपादन वातावरण में या आईआरआई एपीआई के माध्यम से परिभाषित किया जाता है। वे कार्य आमतौर पर Linux, Unix या Windows (भौतिक या आभासी) मशीनों पर, ऑन-प्रिमाइसेस या क्लाउड में SortCL बैक-एंड प्रोग्राम में चलते हैं:
SortCL सिंटैक्स में स्क्रिप्ट की गई कुछ नौकरियां भी Hadoop के लिए Voracity Grid (VGrid) संस्करण के लाइसेंसधारियों के लिए Map Reduce 2, Spark, Spark Stream, Story, या Tez में सीधे संशोधन किए बिना चल सकती हैं।
ध्यान दें कि कई अन्य ईटीएल और डेटा मास्किंग कार्यक्रमों के विपरीत, कोई CoSort सर्वर नहीं है जहां SortCL को केंद्रीय रूप से चलाना या प्रबंधित किया जाना चाहिए। हल्का SortCL निष्पादन योग्य रास्पबेरी पाई से z/Linux मेनफ्रेम तक कहीं भी चल सकता है।
इसलिए, ऊपर दिए गए आरेख के अनुसार, साइटों के लिए परीक्षण और QA SortCL इंस्टेंसेस को IRI वर्कबेंच चलाने वाले डेवलपर लैपटॉप पर, साथ ही प्रदर्शन को अनुकूलित करने के लिए केंद्रीकृत फ़ाइल या डेटाबेस सर्वर पर स्थापित करना सामान्य है। यह अक्सर पूछे जाने वाले प्रश्न IRI डेटा मास्किंग उत्पादों के संदर्भ में SortCL को लाइसेंस देने के प्रश्न को शामिल करते हैं, उदाहरण के लिए, और इसके अनुसार इसकी लागतों को कैसे कारक बनाया जाए।
यदि आपके पास इस बारे में कोई प्रश्न है कि आपको किस आईआरआई उत्पाद की आवश्यकता है, या इसे अपने हार्डवेयर पर सर्वोत्तम तरीके से कैसे परिनियोजित करना है (या प्रावधान करने की योजना है), तो कृपया अपने आईआरआई प्रतिनिधि से संपर्क करें।