HBase
 sql >> डेटाबेस >  >> NoSQL >> HBase

एचडीएफएस की शीर्ष 6 विशेषताएं - एक हडूप एचडीएफएस ट्यूटोरियल

हमारे पिछले ब्लॉग में हमने Hadoop HDFS learned सीखा है विस्तार से, अब इस ब्लॉग में, हम एचडीएफएस की विशेषताओं को कवर करने जा रहे हैं। Hadoop HDFS में फॉल्ट टॉलरेंस, प्रतिकृति, विश्वसनीयता, उच्च उपलब्धता, वितरित भंडारण, मापनीयता आदि जैसी विशेषताएं हैं।

Hadoop में HDFS की इन सभी विशेषताओं पर इस Hadoop HDFS ट्यूटोरियल में चर्चा की जाएगी।

Hadoop HDFS का परिचय

Hadoop वितरित फ़ाइल सिस्टम (HDFS) Hadoop की प्राथमिक भंडारण प्रणाली है। यह कमोडिटी हार्डवेयर के क्लस्टर पर चलने वाली बहुत बड़ी फाइलों को स्टोर करता है। एचडीएफएस जीएफएस (गूगल फाइलसिस्टम) पर आधारित है। यह हार्डवेयर के खराब होने की स्थिति में भी डेटा को मज़बूती से संग्रहीत करता है।

एचडीएफएस समानांतर में एक्सेस करके एप्लिकेशन को उच्च-थ्रूपुट एक्सेस भी प्रदान करता है। 2017 के अंत तक एक भविष्यवाणी के अनुसार, ग्रह पर उपलब्ध 75% डेटा HDFS में रहेगा।

HDFS की 6 महत्वपूर्ण विशेषताएं

Hadoop HDFS परिचय का अध्ययन करने के बाद, अब HDFS की सबसे महत्वपूर्ण विशेषताओं पर चर्चा करते हैं।

<एच4>1. दोष सहिष्णुता

Hadoop HDFS में दोष सहिष्णुता प्रतिकूल परिस्थितियों में एक सिस्टम की कार्य शक्ति है। यह अत्यधिक दोष-सहिष्णु है। Hadoop फ्रेमवर्क डेटा को ब्लॉक में विभाजित करता है। उसके बाद क्लस्टर में विभिन्न मशीनों पर ब्लॉक की कई प्रतियां बनाता है।

इसलिए, जब क्लस्टर में कोई भी मशीन डाउन हो जाती है, तो क्लाइंट आसानी से अपने डेटा को दूसरी मशीन से एक्सेस कर सकता है जिसमें डेटा ब्लॉक की समान कॉपी होती है।

<एच4>2. उच्च उपलब्धता

Hadoop HDFS एक अत्यधिक उपलब्ध फ़ाइल सिस्टम है। एचडीएफएस में, एचडीएफएस क्लस्टर में मौजूद अन्य दासों पर ब्लॉक की प्रतिकृति बनाकर हडूप क्लस्टर में नोड्स के बीच डेटा दोहराया जाता है। इसलिए, जब भी कोई उपयोगकर्ता इस डेटा को एक्सेस करना चाहता है, तो वे अपने डेटा को उन दासों से एक्सेस कर सकते हैं जिनमें इसके ब्लॉक होते हैं।

एक नोड की विफलता जैसी प्रतिकूल परिस्थितियों के समय, एक उपयोगकर्ता अन्य नोड्स से अपने डेटा को आसानी से एक्सेस कर सकता है। क्योंकि ब्लॉक की डुप्लीकेट कॉपी एचडीएफएस क्लस्टर में अन्य नोड्स पर मौजूद होती है।

<एच4>3. उच्च विश्वसनीयता

एचडीएफएस विश्वसनीय डेटा भंडारण प्रदान करता है। यह डेटा को 100s पेटाबाइट्स की रेंज में स्टोर कर सकता है। HDFS डेटा को क्लस्टर पर मज़बूती से स्टोर करता है। यह डेटा को ब्लॉक में विभाजित करता है। Hadoop फ्रेमवर्क इन ब्लॉक्स को HDFS क्लस्टर में मौजूद नोड्स पर स्टोर करता है।

HDFS क्लस्टर में मौजूद प्रत्येक ब्लॉक की प्रतिकृति बनाकर मज़बूती से डेटा संग्रहीत करता है। इसलिए दोष सहिष्णुता सुविधा प्रदान करता है। यदि डेटा वाले क्लस्टर में नोड नीचे चला जाता है, तो उपयोगकर्ता उस डेटा को अन्य नोड्स से आसानी से एक्सेस कर सकता है।

एचडीएफएस डिफ़ॉल्ट रूप से नोड्स में मौजूद डेटा वाले प्रत्येक ब्लॉक की 3 प्रतिकृतियां बनाता है। इसलिए, डेटा उपयोगकर्ताओं के लिए जल्दी उपलब्ध है। इसलिए उपयोगकर्ता को डेटा हानि की समस्या का सामना नहीं करना पड़ता है। इस प्रकार, एचडीएफएस अत्यधिक विश्वसनीय है।

<एच4>4. प्रतिकृति

डेटा प्रतिकृति एचडीएफएस की अनूठी विशेषता है। प्रतिकृति एक प्रतिकूल स्थिति में डेटा हानि की समस्या को हल करती है जैसे हार्डवेयर विफलता, नोड्स का क्रैश होना आदि। एचडीएफएस समय के नियमित अंतराल पर प्रतिकृति की प्रक्रिया को बनाए रखता है।

एचडीएफएस क्लस्टर में मौजूद विभिन्न मशीनों पर उपयोगकर्ता डेटा की प्रतिकृतियां भी बनाता रहता है। इसलिए, जब कोई नोड नीचे चला जाता है, तो उपयोगकर्ता अन्य मशीनों से डेटा तक पहुंच सकता है। इस प्रकार, उपयोगकर्ता डेटा के खोने की कोई संभावना नहीं है।

5. मापनीयता

Hadoop HDFS क्लस्टर में कई नोड्स पर डेटा स्टोर करता है। इसलिए, जब भी आवश्यकताएं बढ़ती हैं तो आप क्लस्टर को बढ़ा सकते हैं। एचडीएफएस में दो मापनीयता तंत्र उपलब्ध हैं:ऊर्ध्वाधर और क्षैतिज मापनीयता।

<एच4>6. वितरित संग्रहण

एचडीएफएस में सभी सुविधाएं वितरित भंडारण और प्रतिकृति के माध्यम से प्राप्त की जाती हैं। HDFS डेटा को नोड्स में वितरित तरीके से संग्रहीत करता है। Hadoop में, डेटा को ब्लॉक में विभाजित किया जाता है और HDFS क्लस्टर में मौजूद नोड्स पर संग्रहीत किया जाता है।

उसके बाद एचडीएफएस प्रत्येक ब्लॉक की प्रतिकृति बनाता है और अन्य नोड्स पर स्टोर करता है। जब क्लस्टर में एक मशीन दुर्घटनाग्रस्त हो जाती है तो हम अपने डेटा को अन्य नोड्स से आसानी से एक्सेस कर सकते हैं जिसमें इसकी प्रतिकृति होती है।

निष्कर्ष

अंत में, हम कह सकते हैं, एचडीएफएस अत्यधिक दोष सहिष्णु है। यह हार्डवेयर की विफलता के बावजूद बड़ी मात्रा में डेटा को मज़बूती से संग्रहीत करता है। यह उच्च मापनीयता और उच्च उपलब्धता भी प्रदान करता है। इसलिए HDFS Hadoop कार्यक्षमता को सशक्त बनाता है। यदि आपको एचडीएफएस की कोई अन्य विशेषता मिलती है, तो कृपया नीचे टिप्पणी अनुभाग में हमारे साथ साझा करें।


  1. Redis
  2.   
  3. MongoDB
  4.   
  5. Memcached
  6.   
  7. HBase
  8.   
  9. CouchDB
  1. Apache Hadoop के साथ निकट रीयल-टाइम डेटा प्रोसेसिंग के लिए आर्किटेक्चरल पैटर्न

  2. जन्मदिन मुबारक हो अपाचे HBase! लचीलापन, स्थिरता और प्रदर्शन के 10 साल

  3. Hadoop - शुरुआती के लिए एक Apache Hadoop ट्यूटोरियल

  4. कैसे करें:Hue . के माध्यम से HBase डेटा प्रबंधित करें

  5. 6 बेस्ट मैपरिड्यूस जॉब ऑप्टिमाइजेशन तकनीक