Database
 sql >> डेटाबेस >  >> RDS >> Database

Microsoft Azure टूल के साथ बड़े डेटा का विश्लेषण करें

बड़ा डेटा

बड़ा डेटा डेटा की बड़ी मात्रा का वर्णन करता है, या तो संरचित या असंरचित, जो दैनिक आधार पर एक व्यवसाय को जलमग्न करता है। बिग डेटा डेटा सेट का विश्लेषण करने, उससे जानकारी निकालने या उससे निपटने के तरीकों का इलाज करता है जो सामान्य डेटा-प्रोसेसिंग सॉफ़्टवेयर द्वारा निपटाए जाने के लिए बहुत बड़े या जटिल हैं।

बिग डेटा में निम्नलिखित विशेषताएं हैं:

  • वॉल्यूम: उत्पन्न और संग्रहीत डेटा की मात्रा
  • किस्म: डेटा का प्रकार और प्रकृति
  • वेग: जिस गति से डेटा उत्पन्न और संसाधित होता है
  • सत्यता: डेटा गुणवत्ता और डेटा मान

बिग डेटा पर Azure का प्रभाव

Microsoft Azure मशीन लर्निंग टूल्स का उपयोग करके डेटा को कार्रवाई योग्य अंतर्दृष्टि में बदल देता है। यह आपको किसी भी पैमाने पर किसी भी डेटा को संयोजित करने और बड़े पैमाने पर मशीन लर्निंग मॉडल बनाने और तैनात करने की अनुमति देता है।

निम्न Azure उत्पादों के साथ, बिग डेटा पर उन्नत विश्लेषण किए जा सकते हैं:

  • एसक्यूएल डाटा वेयरहाउस
  • डेटा फ़ैक्टरी
  • Azure BLOB संग्रहण
  • Azure Databricks
  • Azure Cosmos DB
  • पावर बीआई

आइए उनमें से प्रत्येक को अलग-अलग देखें।

SQL डेटा वेयरहाउस

SQL डेटा वेयरहाउस एक क्लाउड-आधारित EDW (एंटरप्राइज़ डेटा वेयरहाउस) है जो डेटा के पेटाबाइट्स में जटिल प्रश्नों को चलाने के लिए बड़े पैमाने पर समानांतर प्रसंस्करण (बड़ी संख्या में प्रोसेसर जो समानांतर में संगणना का एक सेट करते हैं) का उपयोग करता है।

आप बस PolyBase T-SQL क्वेरीज़ (वे क्वेरी जो Hadoop से डेटा पढ़ते हैं) के साथ SQL डेटा वेयरहाउस में बड़ा डेटा आयात करते हैं, फिर, MPP की शक्ति के साथ, उच्च-प्रदर्शन विश्लेषिकी चलाते हैं। डेटा वेयरहाउस तब सत्य का एकल संस्करण बन जाएगा, जिस पर आप अंतर्दृष्टि के लिए भरोसा कर सकते हैं।

डेटा फ़ैक्टरी

डेटा फ़ैक्टरी एक क्लाउड डेटा एकीकरण सेवा है जो स्वचालित डेटा पाइपलाइनों में डेटा संग्रहण, संचलन और प्रसंस्करण सेवाओं की रचना करती है। Azure डेटा फ़ैक्टरी एक हाइब्रिड डेटा एकीकरण सेवा है जो आपको ETL/ELT (एक्सट्रैक्ट, ट्रांसफ़ॉर्म, लोड) वर्कफ़्लोज़ बनाने, शेड्यूल करने और व्यवस्थित करने की अनुमति देती है।

Azure BLOB स्टोरेज

Azure BLOB स्टोरेज असंरचित दस्तावेज़ों, छवियों, वीडियो और ऑडियो के लिए एक व्यापक स्केलेबल ऑब्जेक्ट स्टोरेज है। उदाहरण के लिए, Azure BLOB स्टोरेज को बड़ी मात्रा में असंरचित डेटा (डेटा जो किसी विशेष डेटा मॉडल या परिभाषा का पालन नहीं करता है) को संग्रहीत करने के लिए अनुकूलित किया गया है, जैसे टेक्स्ट या बाइनरी डेटा।

Azure BLOB संग्रहण के निम्नलिखित कार्य हैं:

  • दस्तावेज़ों या छवियों को सीधे किसी ब्राउज़र में प्रस्तुत करना
  • वितरित पहुंच के लिए फ़ाइलें संग्रहीत करना
  • ऑडियो और वीडियो स्ट्रीमिंग
  • फ़ाइलें लॉग करने के लिए लेखन
  • आपदा पुनर्प्राप्ति, बैकअप और पुनर्स्थापना, और संग्रह करने के लिए डेटा संग्रहीत करना

Azure Databricks

एज़्योर डेटाब्रिक्स एक आसान, तेज़ और सहयोगी अपाचे स्पार्क-आधारित (ओपन-सोर्स वितरित सामान्य-उद्देश्य क्लस्टर-कंप्यूटिंग फ्रेमवर्क है, जो अंतर्निहित डेटा समानांतरता के साथ प्रोग्रामिंग क्लस्टर के लिए एक इंटरफ़ेस प्रदान करता है) एनालिटिक्स प्लेटफॉर्म है।

Azure Cosmos DB

Azure Cosmos DB एक विश्व स्तर पर वितरित डेटाबेस सेवा है। इसे कम विलंबता, थ्रूपुट की लोचदार मापनीयता, डेटा स्थिरता के लिए अच्छी तरह से परिभाषित शब्दार्थ और उच्च उपलब्धता प्रदान करने के लिए डिज़ाइन किया गया है।

पावर बीआई

पावर बीआई बिजनेस एनालिटिक्स टूल का एक सूट है जो अंतर्दृष्टि प्रदान करता है। Power BI आपको कई डेटा स्रोतों से कनेक्ट करने, डेटा तैयारियों को सरल बनाने, तदर्थ विश्लेषण चलाने के साथ-साथ वेब और मोबाइल उपकरणों पर उपयोग की जाने वाली रिपोर्ट तैयार करने में सक्षम बनाता है।

निष्कर्ष

बिग डेटा विकसित हुआ है, और विकसित होता रहता है। Azure टूल की सहायता से, Big Data अधिक से अधिक प्रबंधनीय हो जाता है।


  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. स्प्रेडशीट बनाम डेटाबेस:क्या यह स्विच करने का समय है? भाग 2

  2. AnySQL मेस्ट्रो को Salesforce.com से कनेक्ट करना

  3. टी-एसक्यूएल में वर्तमान तिथि (बिना समय) कैसे प्राप्त करें?

  4. टेबल एक्सप्रेशन के मूल तत्व, भाग 8 - सीटीई, अनुकूलन विचार जारी रहे

  5. फील्डशील्ड में स्थिर और गतिशील डेटा मास्किंग