HBase
 sql >> डेटाबेस >  >> NoSQL >> HBase

Hadoop और उसके लाभ में जागरूकता रैक

इस Hadoop ट्यूटोरियल Hadoop में सभी के बारे में रैक जागरूकता है। इस ब्लॉग में हम में रैक जागरूकता के बारे में प्रत्येक और सब कुछ का वर्णन करेंगे HDFS

सबसे पहले हम अध्ययन करेगा क्या HDFS रैक जागरूकता संपत्ति है, Hadoop में रैक जागरूकता की जरूरत क्या है। फिर हम HDFS में रैक जागरूकता के माध्यम से प्रतिकृति नियुक्ति पर चर्चा करेंगे।

अंत में हम भी Hadoop ढांचे में रैक जागरूकता के विभिन्न लाभों पर चर्चा करेंगे।

परिचय HDFS रैक जागरूकता

रैक जागरूकता Hadoop में अवधारणा है कि रैक जानकारी के आधार पर करीब Datanodes चुनता है। डिफ़ॉल्ट रूप से, Hadoop स्थापना मानता है कि सभी नोड्स एक ही रैक के हैं।

नेटवर्क यातायात में सुधार करने के जबकि Hadoop के बड़े समूहों में HDFS फ़ाइलों लेखन / पढ़ने। NameNode डेटा नोड्स, जो एक ही रैक या पास के एक रॉक को पढ़ने के लिए कर रहे हैं / लिखने अनुरोध (ग्राहक नोड) चुनता है। एचडीएफएस Namenode प्रत्येक डेटा नोड के रैक आईडी बनाए रखने के द्वारा इस रैक जानकारी प्राप्त होता है।

क्यों रैक जागरूकता?

रैक जागरूकता का मुख्य उद्देश्य के लिए है:

  • डेटा विश्वसनीयता और डेटा की उपलब्धता में सुधार।
  • बेहतर क्लस्टर प्रदर्शन।
  • पूरे रैक में विफल रहता है रोकता डेटा हानि है।
  • नेटवर्क बैंडविड्थ में सुधार करना।
  • में रैक थोक प्रवाह रखें जब संभव हो।

Hadoop में

रैक जागरूकता के माध्यम से प्रतिकृति नियुक्ति

रैक जागरूकता के माध्यम से प्रतिकृति नियुक्ति का मुख्य उद्देश्य, नीति डेटा विश्वसनीयता आदि में सुधार है।

एक साधारण नीति रैक डेटा के खोने जब एक पूरी रैक में विफल रहता है को रोकने के लिए पर जगह प्रतिकृतियां है। जब एक फ़ाइल को पढ़ने और कई रैक से बैंडविड्थ के उपयोग की अनुमति।

कई रैक समूहों पर, ब्लॉक

:प्रतिकृति नीति नीचे इस प्रकार है

आप एक नोड पर एक से अधिक प्रतिकृति जगह नहीं होनी चाहिए। तुम भी एक ही रैक पर दो से अधिक प्रतिकृतियां जगह नहीं होनी चाहिए। यह एक टोंटी कि ब्लॉक प्रतिकृति के लिए इस्तेमाल किया रैक की संख्या हमेशा कम ब्लॉक प्रतिकृतियां की कुल संख्या से होना चाहिए है।

उदाहरण के लिए,

  • जब एक Hadoop ढांचे नए ब्लॉक बनाता है, जिसे स्थानीय नोड पर पहले प्रतिकृति देता है। और एक अलग रैक में एक दूसरे से एक जगह है, और तीसरा एक स्थानीय नोड पर अलग नोड पर है।
  • जब एक ब्लॉक फिर से नकल, मौजूदा प्रतिकृतियां की संख्या एक, एक अलग रैक पर दूसरी जगह। है अगर
  • जब मौजूदा प्रतिकृतियां की संख्या दो कर रहे हैं, अगर दो प्रतिकृतियां एक ही रैक में कर रहे हैं, तीसरा एक अलग रैक पर रख दें।

Hadoop में

रैक जागरूकता के लाभ

चलो अब Hadoop HDFS में रैक जागरूकता के कुछ लाभ पर चर्चा -

  • उच्च बैंडविड्थ और कम विलंबता प्रदान करें - यह नीति एक रैक के भीतर के बजाय रैक के बीच ब्लॉक स्थानांतरित करके नेटवर्क बैंडविड्थ अधिकतम करता है। यार्न नोड्स कि उनके डाटा के करीब नेटवर्क टोपोलॉजी के मामले में कर रहे हैं करने के लिए कार्य बताए द्वारा MapReduce नौकरी प्रदर्शन का अनुकूलन करने में सक्षम है।
  • डेटा संरक्षण रैक विफलता के खिलाफ प्रदान करता है - पहले प्रतिकृति से अलग रैक में नोड्स ब्लॉक 2 और 3 ब्लॉक की प्रतिकृतियां आवंटित Namenode। इस प्रकार, यह भी रैक विफलता के खिलाफ डेटा सुरक्षा प्रदान करता है। बहरहाल, यह केवल तभी संभव है Hadoop अपने रैक विन्यास के ज्ञान के साथ कॉन्फ़िगर किया गया था।
  • लेखन लागत और अधिकतम कम से कम गति पढ़ा - रैक जागरूकता, नीति स्थानों प्रतिकृतियां जो एक ही रैक में हैं / अनुरोध लेखन। इस प्रकार, इस कम करता लेखन लागत और गति पढ़ने अधिकतम करता है।

निष्कर्ष

अंत में, यह अवधारणा है कि डेटा विश्वसनीयता में सुधार करने के रैक जानकारी के आधार पर करीब Datanodes चुनता है। रैक-जागरूकता का मुख्य उद्देश्य है, तो पूरे रैक में विफल रहता है डेटा हानि को रोकने के लिए है। यह भी नेटवर्क बैंडविड्थ में सुधार। विस्तार से जानें HDFS गुण।

आप Hadoop में जागरूकता रैक से संबंधित किसी भी प्रश्न हैं, तो टिप्पणी अनुभाग में हमारे साथ साझा करें। हम आपकी मदद करने में अपनी पूरी कोशिश करेंगे।


  1. Redis
  2.   
  3. MongoDB
  4.   
  5. Memcached
  6.   
  7. HBase
  8.   
  9. CouchDB
  1. Hadoop उच्च उपलब्धता सुविधा को समझना

  2. Hadoop MapReduce में सट्टा निष्पादन

  3. अपाचे HBase + अपाचे Hadoop + Xceivers

  4. Apache HBase स्नैपशॉट का परिचय, भाग 2:गहरा गोता

  5. हडूप क्लस्टर क्या है? Hadoop क्लस्टर बनाने के सर्वोत्तम अभ्यास