इस Hadoop ट्यूटोरियल . का उद्देश्य आपको विभिन्न Hadoop संस्करण के बीच एक स्पष्ट समझ प्रदान करना है। इस ब्लॉग में हमने शीर्ष, Hadoop 2.x बनाम Hadoop 3.x के बीच के 20 अंतर को कवर किया है।
यह ब्लॉग विभिन्न विशेषताओं के आधार पर Hadoop 2 और Hadoop 3 के बीच के अंतर को कवर करता है।
Hadoop 2.x बनाम Hadoop 3.x के बीच अंतर
अपाचे हडोप बड़ी मात्रा में डेटा सेट के वितरित भंडारण और प्रसंस्करण के लिए एक खुला स्रोत सॉफ्टवेयर ढांचा है।
Hadoop 3.x को Hadoop की सीमा . को दूर करने के लिए पेश किया गया था 2. x Hadoop 3.x ने कुछ नई सुविधाएँ जोड़ी हैं, हालाँकि पुरानी सुविधाएँ अभी भी उपयोग की जाती हैं।
Hadoop 2.x बनाम Hadoop 3.x के बीच विस्तृत फीचर वार तुलना नीचे दी गई है:
ए. लाइसेंस
- हडूप 2 .x- अपाचे 2.0, खुला स्रोत
- हडूप 3 .x- अपाचे 2.0, खुला स्रोत
- हडूप 2 .x- जावा 7.
- हडूप 3 .x- जावा 8.
सी. दोष सहिष्णुता
- Hadoop 2.x- इस संस्करण में, प्रतिकृति दोष सहिष्णुता को संभालती है।
- Hadoop 3.x- इस संस्करण में, इरेज़र कोडिंग दोष सहनशीलता को संभालती है।
- Hadoop 2.x- HDFS का उपयोग करता है डेटा संतुलन के लिए बैलेंसर
- Hadoop 3.x- इंट्रा-डेटा नोड बैलेंसर का उपयोग करता है, जिसे एचडीएफएस डिस्क बैलेंसर सीएलआई के माध्यम से लागू किया जाता है।
ई. भंडारण योजना
- Hadoop 2.x- 3X प्रतिकृति योजना का उपयोग करता है।
- Hadoop 3.x- इरेज़र कोडिंग का उपयोग करता है।
- Hadoop 2.x- इस संस्करण में एचडीएफएस में स्टोरेज स्पेस में 200% ओवरहेड है।
- Hadoop 3.x- इस संस्करण में स्टोरेज स्पेस में एचडीएफएस का 50% ओवरहेड है।
- Hadoop 2.x- यदि प्रत्येक ब्लॉक के 6 ब्लॉक और 3x प्रतिकृति हैं, तो इसका परिणाम 18 ब्लॉकों में होता है। यह 18 ब्लॉक स्थान घेरेगा।
- Hadoop 3.x- यदि 6 ब्लॉक हैं, तो यह 9 ब्लॉक स्पेस पर कब्जा कर लेगा यानी 6 ब्लॉक और 3 समता के लिए।
- Hadoop 2.x- पुरानी टाइमलाइन सेवा का उपयोग करता है जिसमें मापनीयता संबंधी समस्याएं हैं।
- Hadoop 3.x- यह संस्करण टाइमलाइन सेवा v2. यह टाइमलाइन सेवा की मापनीयता और विश्वसनीयता में भी सुधार करता है।
जे. डिफ़ॉल्ट पोर्ट रेंज
- Hadoop 2.x- इस संस्करण में, डिफ़ॉल्ट पोर्ट लिनक्स अल्पकालिक पोर्ट रेंज हैं। इसलिए स्टार्टअप के समय, वे बाइंड करने में विफल रहेंगे।
- Hadoop 3.x- जबकि इस संस्करण को अल्पकालिक सीमा से बाहर ले जाया गया है।
के. उपकरण
- Hadoop 2.x- हाइव, पिग, तेज़, हमा, और अन्य Hadoop टूल भी उपलब्ध हैं।
- Hadoop 3.x- इस संस्करण में हाइव, पिग, तेज, हमा और अन्य हडूप टूल भी उपलब्ध हैं।
एल. संगत फ़ाइल सिस्टम
- Hadoop 2.x- यह एचडीएफएस (डिफ़ॉल्ट एफएस), एफ़टीपी फाइल सिस्टम का समर्थन करता है:यह अपने सभी डेटा को दूरस्थ रूप से सुलभ एफ़टीपी सर्वर पर भी संग्रहीत करता है। यह Amazon S3 (Simple Storage Service) फाइल सिस्टम Windows Azure Storage Blobs (WASB) फाइल सिस्टम को भी सपोर्ट करता है।
- Hadoop 3.x- यह पिछले सभी के साथ-साथ Microsoft Azure डेटा लेक फ़ाइल सिस्टम का समर्थन करता है।
- Hadoop 2.x- MapReduce के लिए डेटानोड संसाधन समर्पित नहीं है। हम इसे अन्य एप्लिकेशन के लिए भी उपयोग कर सकते हैं।
- Hadoop 3.x- इस संस्करण में भी डेटा नोड संसाधन का उपयोग अन्य अनुप्रयोगों के लिए भी किया जा सकता है।
एन. एमआर एपीआई संगतता
- Hadoop 2.x- Hadoop 2.X पर निष्पादित करने के लिए Hadoop 1.x प्रोग्राम के साथ संगत MR API
- Hadoop 3.x- MR API, Hadoop 3.X पर निष्पादित करने के लिए Hadoop 1.x प्रोग्राम चलाने के साथ भी संगत है।
ओ. माइक्रोसॉफ्ट के लिए समर्थन
- Hadoop 2.x- इसे विंडोज़ पर तैनात किया जा सकता है।
- Hadoop 3.x- यह माइक्रोसॉफ्ट विंडोज़ के लिए भी सपोर्ट करता है।
पी. स्लॉट/कंटेनर
- Hadoop 2.x- Hadoop 1.x स्लॉट की अवधारणा पर काम करता है जबकि Hadoop 2.X कंटेनर की अवधारणा पर काम करता है।
- Hadoop 3.x- Hadoop 3.x एक कंटेनर की अवधारणा पर भी काम करता है।
- Hadoop 2.x- इसमें एसपीओएफ को मात देने की विशेषताएं हैं। इसलिए, जब भी NameNode विफल हो जाता है तो यह अपने आप ठीक हो जाता है।
- Hadoop 3.x- इसमें एसपीओएफ को मात देने की विशेषताएं भी हैं। इसलिए, जब भी NameNode विफल हो जाता है तो यह स्वचालित रूप से ठीक हो जाता है, मैन्युअल हस्तक्षेप की कोई आवश्यकता नहीं है।
आर. एचडीएफएस फेडरेशन
- Hadoop 2.x- Hadoop 1.x में सभी नेमस्पेस को प्रबंधित करने के लिए केवल एक ही NameNode है। लेकिन Hadoop 2.x में कई नामस्थान के लिए कई NameNode हैं।
- Hadoop 3.x- इसमें कई नामस्थानों के लिए कई नामेनोड भी हैं।
एस. मापनीयता
- Hadoop 2.x- हम प्रति क्लस्टर 10000 नोड्स तक बढ़ा सकते हैं।
- Hadoop 3.x- हम प्रति क्लस्टर 10000 से अधिक नोड्स स्केल कर सकते हैं।
टी. एचडीएफएस स्नैपशॉट
- Hadoop 2.x- यह एक स्नैपशॉट के लिए समर्थन जोड़ता है। यह उपयोगकर्ता त्रुटि के लिए आपदा वसूली और सुरक्षा भी प्रदान करता है।
- Hadoop 3.x- यह स्नैपशॉट सुविधा के लिए भी समर्थन करता है।
यू. प्लेटफार्म
- Hadoop 2.x- यह डेटा एनालिटिक्स की एक विस्तृत विविधता के लिए एक मंच के रूप में कार्य करता है। इवेंट प्रोसेसिंग, स्ट्रीमिंग और रीयल-टाइम संचालन चलाना भी संभव है।
- Hadoop 3.x- YARN के शीर्ष पर ईवेंट प्रोसेसिंग, स्ट्रीमिंग और रीयल-टाइम ऑपरेशन चलाना भी संभव है।
निष्कर्ष
अंत में, Hadoop 3.0 ने गलती सहनशीलता को संभालने के लिए इरेज़र कोडिंग जैसी नई सुविधाएँ जोड़ी हैं। Hadoop 3.x भी स्टोरेज ओवरहेड को 200% से 50% तक कम कर देता है।
इसने डिस्क बैलेंसर नामक एक नया कमांड लाइन टूल भी पेश किया। इसलिए, Hadoop 3.x ने समग्र प्रदर्शन में सुधार किया है।
यदि आपको Hadoop 2.x बनाम Hadoop 3.x के बीच कोई अन्य अंतर मिलता है, तो हमें टिप्पणी अनुभाग में बताएं।