बड़ा डेटा
बड़ा डेटा डेटा की बड़ी मात्रा का वर्णन करता है, या तो संरचित या असंरचित, जो दैनिक आधार पर एक व्यवसाय को जलमग्न करता है। बिग डेटा डेटा सेट का विश्लेषण करने, उससे जानकारी निकालने या उससे निपटने के तरीकों का इलाज करता है जो सामान्य डेटा-प्रोसेसिंग सॉफ़्टवेयर द्वारा निपटाए जाने के लिए बहुत बड़े या जटिल हैं।
बिग डेटा में निम्नलिखित विशेषताएं हैं:
- वॉल्यूम: उत्पन्न और संग्रहीत डेटा की मात्रा
- किस्म: डेटा का प्रकार और प्रकृति
- वेग: जिस गति से डेटा उत्पन्न और संसाधित होता है
- सत्यता: डेटा गुणवत्ता और डेटा मान
बिग डेटा पर Azure का प्रभाव
Microsoft Azure मशीन लर्निंग टूल्स का उपयोग करके डेटा को कार्रवाई योग्य अंतर्दृष्टि में बदल देता है। यह आपको किसी भी पैमाने पर किसी भी डेटा को संयोजित करने और बड़े पैमाने पर मशीन लर्निंग मॉडल बनाने और तैनात करने की अनुमति देता है।
निम्न Azure उत्पादों के साथ, बिग डेटा पर उन्नत विश्लेषण किए जा सकते हैं:
- एसक्यूएल डाटा वेयरहाउस
- डेटा फ़ैक्टरी
- Azure BLOB संग्रहण
- Azure Databricks
- Azure Cosmos DB
- पावर बीआई
आइए उनमें से प्रत्येक को अलग-अलग देखें।
SQL डेटा वेयरहाउस
SQL डेटा वेयरहाउस एक क्लाउड-आधारित EDW (एंटरप्राइज़ डेटा वेयरहाउस) है जो डेटा के पेटाबाइट्स में जटिल प्रश्नों को चलाने के लिए बड़े पैमाने पर समानांतर प्रसंस्करण (बड़ी संख्या में प्रोसेसर जो समानांतर में संगणना का एक सेट करते हैं) का उपयोग करता है।
आप बस PolyBase T-SQL क्वेरीज़ (वे क्वेरी जो Hadoop से डेटा पढ़ते हैं) के साथ SQL डेटा वेयरहाउस में बड़ा डेटा आयात करते हैं, फिर, MPP की शक्ति के साथ, उच्च-प्रदर्शन विश्लेषिकी चलाते हैं। डेटा वेयरहाउस तब सत्य का एकल संस्करण बन जाएगा, जिस पर आप अंतर्दृष्टि के लिए भरोसा कर सकते हैं।
डेटा फ़ैक्टरी
डेटा फ़ैक्टरी एक क्लाउड डेटा एकीकरण सेवा है जो स्वचालित डेटा पाइपलाइनों में डेटा संग्रहण, संचलन और प्रसंस्करण सेवाओं की रचना करती है। Azure डेटा फ़ैक्टरी एक हाइब्रिड डेटा एकीकरण सेवा है जो आपको ETL/ELT (एक्सट्रैक्ट, ट्रांसफ़ॉर्म, लोड) वर्कफ़्लोज़ बनाने, शेड्यूल करने और व्यवस्थित करने की अनुमति देती है।
Azure BLOB स्टोरेज
Azure BLOB स्टोरेज असंरचित दस्तावेज़ों, छवियों, वीडियो और ऑडियो के लिए एक व्यापक स्केलेबल ऑब्जेक्ट स्टोरेज है। उदाहरण के लिए, Azure BLOB स्टोरेज को बड़ी मात्रा में असंरचित डेटा (डेटा जो किसी विशेष डेटा मॉडल या परिभाषा का पालन नहीं करता है) को संग्रहीत करने के लिए अनुकूलित किया गया है, जैसे टेक्स्ट या बाइनरी डेटा।
Azure BLOB संग्रहण के निम्नलिखित कार्य हैं:
- दस्तावेज़ों या छवियों को सीधे किसी ब्राउज़र में प्रस्तुत करना
- वितरित पहुंच के लिए फ़ाइलें संग्रहीत करना
- ऑडियो और वीडियो स्ट्रीमिंग
- फ़ाइलें लॉग करने के लिए लेखन
- आपदा पुनर्प्राप्ति, बैकअप और पुनर्स्थापना, और संग्रह करने के लिए डेटा संग्रहीत करना
Azure Databricks
एज़्योर डेटाब्रिक्स एक आसान, तेज़ और सहयोगी अपाचे स्पार्क-आधारित (ओपन-सोर्स वितरित सामान्य-उद्देश्य क्लस्टर-कंप्यूटिंग फ्रेमवर्क है, जो अंतर्निहित डेटा समानांतरता के साथ प्रोग्रामिंग क्लस्टर के लिए एक इंटरफ़ेस प्रदान करता है) एनालिटिक्स प्लेटफॉर्म है।
Azure Cosmos DB
Azure Cosmos DB एक विश्व स्तर पर वितरित डेटाबेस सेवा है। इसे कम विलंबता, थ्रूपुट की लोचदार मापनीयता, डेटा स्थिरता के लिए अच्छी तरह से परिभाषित शब्दार्थ और उच्च उपलब्धता प्रदान करने के लिए डिज़ाइन किया गया है।
पावर बीआई
पावर बीआई बिजनेस एनालिटिक्स टूल का एक सूट है जो अंतर्दृष्टि प्रदान करता है। Power BI आपको कई डेटा स्रोतों से कनेक्ट करने, डेटा तैयारियों को सरल बनाने, तदर्थ विश्लेषण चलाने के साथ-साथ वेब और मोबाइल उपकरणों पर उपयोग की जाने वाली रिपोर्ट तैयार करने में सक्षम बनाता है।
निष्कर्ष
बिग डेटा विकसित हुआ है, और विकसित होता रहता है। Azure टूल की सहायता से, Big Data अधिक से अधिक प्रबंधनीय हो जाता है।