Hadoop 2.x बनाम Hadoop 3.x . के बीच 20 उल्लेखनीय अंतर

इस Hadoop ट्यूटोरियल . का उद्देश्य आपको विभिन्न Hadoop संस्करण के बीच एक स्पष्ट समझ प्रदान करना है। इस ब्लॉग में हमने शीर्ष, Hadoop 2.x बनाम Hadoop 3.x के बीच के 20 अंतर को कवर किया है।

यह ब्लॉग विभिन्न विशेषताओं के आधार पर Hadoop 2 और Hadoop 3 के बीच के अंतर को कवर करता है।

Hadoop 2.x बनाम Hadoop 3.x के बीच अंतर

अपाचे हडोप बड़ी मात्रा में डेटा सेट के वितरित भंडारण और प्रसंस्करण के लिए एक खुला स्रोत सॉफ्टवेयर ढांचा है।

Hadoop 3.x को Hadoop की सीमा . को दूर करने के लिए पेश किया गया था 2. x Hadoop 3.x ने कुछ नई सुविधाएँ जोड़ी हैं, हालाँकि पुरानी सुविधाएँ अभी भी उपयोग की जाती हैं।

Hadoop 2.x बनाम Hadoop 3.x के बीच विस्तृत फीचर वार तुलना नीचे दी गई है:

ए. लाइसेंस

हडूप 2 .x- अपाचे 2.0, खुला स्रोत
हडूप 3 .x- अपाचे 2.0, खुला स्रोत

<एच4>बी. जावा का न्यूनतम समर्थित संस्करण

हडूप 2 .x- जावा 7.
हडूप 3 .x- जावा 8.

सी. दोष सहिष्णुता

Hadoop 2.x- इस संस्करण में, प्रतिकृति दोष सहिष्णुता को संभालती है।
Hadoop 3.x- इस संस्करण में, इरेज़र कोडिंग दोष सहनशीलता को संभालती है।

<एच4>डी. डेटा संतुलन

Hadoop 2.x- HDFS का उपयोग करता है डेटा संतुलन के लिए बैलेंसर
Hadoop 3.x- इंट्रा-डेटा नोड बैलेंसर का उपयोग करता है, जिसे एचडीएफएस डिस्क बैलेंसर सीएलआई के माध्यम से लागू किया जाता है।

ई. भंडारण योजना

Hadoop 2.x- 3X प्रतिकृति योजना का उपयोग करता है।
Hadoop 3.x- इरेज़र कोडिंग का उपयोग करता है।

<एच4>एफ. संग्रहण ओवरहेड

Hadoop 2.x- इस संस्करण में एचडीएफएस में स्टोरेज स्पेस में 200% ओवरहेड है।
Hadoop 3.x- इस संस्करण में स्टोरेज स्पेस में एचडीएफएस का 50% ओवरहेड है।

<एच4>जी. स्टोरेज ओवरहेड उदाहरण

Hadoop 2.x- यदि प्रत्येक ब्लॉक के 6 ब्लॉक और 3x प्रतिकृति हैं, तो इसका परिणाम 18 ब्लॉकों में होता है। यह 18 ब्लॉक स्थान घेरेगा।
Hadoop 3.x- यदि 6 ब्लॉक हैं, तो यह 9 ब्लॉक स्पेस पर कब्जा कर लेगा यानी 6 ब्लॉक और 3 समता के लिए।

<एच4>एच. YARN टाइमलाइन सेवा

Hadoop 2.x- पुरानी टाइमलाइन सेवा का उपयोग करता है जिसमें मापनीयता संबंधी समस्याएं हैं।
Hadoop 3.x- यह संस्करण टाइमलाइन सेवा v2. यह टाइमलाइन सेवा की मापनीयता और विश्वसनीयता में भी सुधार करता है।

जे. डिफ़ॉल्ट पोर्ट रेंज

Hadoop 2.x- इस संस्करण में, डिफ़ॉल्ट पोर्ट लिनक्स अल्पकालिक पोर्ट रेंज हैं। इसलिए स्टार्टअप के समय, वे बाइंड करने में विफल रहेंगे।
Hadoop 3.x- जबकि इस संस्करण को अल्पकालिक सीमा से बाहर ले जाया गया है।

के. उपकरण

Hadoop 2.x- हाइव, पिग, तेज़, हमा, और अन्य Hadoop टूल भी उपलब्ध हैं।
Hadoop 3.x- इस संस्करण में हाइव, पिग, तेज, हमा और अन्य हडूप टूल भी उपलब्ध हैं।

एल. संगत फ़ाइल सिस्टम

Hadoop 2.x- यह एचडीएफएस (डिफ़ॉल्ट एफएस), एफ़टीपी फाइल सिस्टम का समर्थन करता है:यह अपने सभी डेटा को दूरस्थ रूप से सुलभ एफ़टीपी सर्वर पर भी संग्रहीत करता है। यह Amazon S3 (Simple Storage Service) फाइल सिस्टम Windows Azure Storage Blobs (WASB) फाइल सिस्टम को भी सपोर्ट करता है।
Hadoop 3.x- यह पिछले सभी के साथ-साथ Microsoft Azure डेटा लेक फ़ाइल सिस्टम का समर्थन करता है।

<एच4>एम. डेटानोड संसाधन

Hadoop 2.x- MapReduce के लिए डेटानोड संसाधन समर्पित नहीं है। हम इसे अन्य एप्लिकेशन के लिए भी उपयोग कर सकते हैं।
Hadoop 3.x- इस संस्करण में भी डेटा नोड संसाधन का उपयोग अन्य अनुप्रयोगों के लिए भी किया जा सकता है।

एन. एमआर एपीआई संगतता

Hadoop 2.x- Hadoop 2.X पर निष्पादित करने के लिए Hadoop 1.x प्रोग्राम के साथ संगत MR API
Hadoop 3.x- MR API, Hadoop 3.X पर निष्पादित करने के लिए Hadoop 1.x प्रोग्राम चलाने के साथ भी संगत है।

ओ. माइक्रोसॉफ्ट के लिए समर्थन

Hadoop 2.x- इसे विंडोज़ पर तैनात किया जा सकता है।
Hadoop 3.x- यह माइक्रोसॉफ्ट विंडोज़ के लिए भी सपोर्ट करता है।

पी. स्लॉट/कंटेनर

Hadoop 2.x- Hadoop 1.x स्लॉट की अवधारणा पर काम करता है जबकि Hadoop 2.X कंटेनर की अवधारणा पर काम करता है।
Hadoop 3.x- Hadoop 3.x एक कंटेनर की अवधारणा पर भी काम करता है।

<एच4>क्यू. विफलता का एकल बिंदु

Hadoop 2.x- इसमें एसपीओएफ को मात देने की विशेषताएं हैं। इसलिए, जब भी NameNode विफल हो जाता है तो यह अपने आप ठीक हो जाता है।
Hadoop 3.x- इसमें एसपीओएफ को मात देने की विशेषताएं भी हैं। इसलिए, जब भी NameNode विफल हो जाता है तो यह स्वचालित रूप से ठीक हो जाता है, मैन्युअल हस्तक्षेप की कोई आवश्यकता नहीं है।

आर. एचडीएफएस फेडरेशन

Hadoop 2.x- Hadoop 1.x में सभी नेमस्पेस को प्रबंधित करने के लिए केवल एक ही NameNode है। लेकिन Hadoop 2.x में कई नामस्थान के लिए कई NameNode हैं।
Hadoop 3.x- इसमें कई नामस्थानों के लिए कई नामेनोड भी हैं।

एस. मापनीयता

Hadoop 2.x- हम प्रति क्लस्टर 10000 नोड्स तक बढ़ा सकते हैं।
Hadoop 3.x- हम प्रति क्लस्टर 10000 से अधिक नोड्स स्केल कर सकते हैं।

टी. एचडीएफएस स्नैपशॉट

Hadoop 2.x- यह एक स्नैपशॉट के लिए समर्थन जोड़ता है। यह उपयोगकर्ता त्रुटि के लिए आपदा वसूली और सुरक्षा भी प्रदान करता है।
Hadoop 3.x- यह स्नैपशॉट सुविधा के लिए भी समर्थन करता है।

यू. प्लेटफार्म

Hadoop 2.x- यह डेटा एनालिटिक्स की एक विस्तृत विविधता के लिए एक मंच के रूप में कार्य करता है। इवेंट प्रोसेसिंग, स्ट्रीमिंग और रीयल-टाइम संचालन चलाना भी संभव है।
Hadoop 3.x- YARN के शीर्ष पर ईवेंट प्रोसेसिंग, स्ट्रीमिंग और रीयल-टाइम ऑपरेशन चलाना भी संभव है।

निष्कर्ष

अंत में, Hadoop 3.0 ने गलती सहनशीलता को संभालने के लिए इरेज़र कोडिंग जैसी नई सुविधाएँ जोड़ी हैं। Hadoop 3.x भी स्टोरेज ओवरहेड को 200% से 50% तक कम कर देता है।

इसने डिस्क बैलेंसर नामक एक नया कमांड लाइन टूल भी पेश किया। इसलिए, Hadoop 3.x ने समग्र प्रदर्शन में सुधार किया है।

यदि आपको Hadoop 2.x बनाम Hadoop 3.x के बीच कोई अन्य अंतर मिलता है, तो हमें टिप्पणी अनुभाग में बताएं।