HBase
 sql >> डेटाबेस >  >> NoSQL >> HBase

Hadoop उच्च उपलब्धता सुविधा को समझना

यह ब्लॉग आपको Hadoop . का विवरण प्रदान करता है एचडीएफएस उच्च उपलब्धता सुविधा। इस ब्लॉग में सबसे पहले हम चर्चा करेंगे कि वास्तव में उच्च उपलब्धता क्या है, Hadoop उच्च उपलब्धता कैसे प्राप्त करता है, HDFS उच्च उपलब्धता सुविधा की क्या आवश्यकता है।

हम इस बिग डेटा हडूप ट्यूटोरियल में Hadoop उच्च उपलब्धता सुविधा के उदाहरण को भी शामिल करेंगे।

Hadoop HDFS उच्च उपलब्धता क्या है?

हडूप एचडीएफएस एक वितरित फाइल सिस्टम है। HDFS फ़ाइल की प्रतिकृति बनाकर Hadoop क्लस्टर में नोड्स के बीच डेटा वितरित करता है। Hadoop फ्रेमवर्क फाइलों की इन प्रतिकृतियों को क्लस्टर में मौजूद अन्य मशीनों पर संग्रहीत करता है।

इसलिए, जब कोई एचडीएफएस क्लाइंट अपने डेटा को एक्सेस करना चाहता है, तो वह क्लस्टर में मौजूद कई मशीनों से उस डेटा को आसानी से एक्सेस कर सकता है। क्लस्टर में निकटतम नोड में डेटा आसानी से उपलब्ध है।

एक नोड की विफलता जैसी कुछ प्रतिकूल परिस्थितियों में, क्लाइंट अन्य नोड्स से अपने डेटा को आसानी से एक्सेस कर सकता है। Hadoop की इस विशेषता को उच्च उपलब्धता . कहा जाता है ।

Hadoop में उच्च उपलब्धता कैसे प्राप्त की जाती है?

HDFS क्लस्टर में कई DataNodes हैं . निश्चित समय अंतराल के बाद, ये सभी DataNodes NameNode . को दिल की धड़कन के संदेश भेजते हैं . यदि NameNode इनमें से किसी भी DataNode से दिल की धड़कन के संदेश प्राप्त करना बंद कर देता है, तो यह इसे मृत मान लेता है।

उसके बाद, यह उन नोड्स में मौजूद डेटा की जांच करता है और फिर अन्य डेटानोड को उस डेटा की प्रतिकृति बनाने के लिए अन्य डेटानोड को आदेश देता है। इसलिए डेटा हमेशा उपलब्ध रहता है।

जब कोई क्लाइंट HDFS में डेटा एक्सेस मांगता है, तो सबसे पहले, NameNode उस डेटानोड में डेटा की खोज करता है, जिसमें डेटा जल्दी उपलब्ध होता है। और फिर क्लाइंट को उस डेटा तक पहुंच प्रदान करता है।

ग्राहकों को सभी डेटानोड्स में डेटा की खोज करने की आवश्यकता नहीं है। एचडीएफएस नामेनोड स्वयं डेटानोड का पता प्रदान करके ग्राहकों के लिए डेटा उपलब्धता को आसान बनाता है जहां से उपयोगकर्ता सीधे पढ़ सकता है।

Hadoop उच्च उपलब्धता का उदाहरण

Hadoop HDFS डेटा की उच्च उपलब्धता प्रदान करता है। जब क्लाइंट डेटा एक्सेस के लिए NameNode का अनुरोध करता है, तो NameNode उन सभी नोड्स की खोज करता है जिनमें वह डेटा उपलब्ध है।

उसके बाद, यह उपयोगकर्ता को उस नोड से उस डेटा तक पहुंच प्रदान करता है जिसमें डेटा जल्दी से उपलब्ध था। क्लस्टर में सभी नोड्स पर डेटा की खोज करते समय, यदि NameNode कुछ नोड को मृत पाता है, तो उपयोगकर्ता ज्ञान के बिना NameNode पुनर्निर्देशित करता है दूसरे नोड के लिए उपयोगकर्ता जिसमें समान डेटा उपलब्ध है।

बिना किसी रुकावट के यूजर को डाटा उपलब्ध कराया जाता है। तो नोड विफलता की स्थिति में भी डेटा उपयोगकर्ताओं के लिए अत्यधिक उपलब्ध है।

लीगेसी सिस्टम में क्या समस्याएं थीं?

  • मशीन खराब होने के कारण डेटा उपलब्ध नहीं था।
  • HDFS क्लाइंट को अपने डेटा तक पहुंचने के लिए लंबे समय तक इंतजार करना पड़ता है। अधिकांश समय उपयोगकर्ताओं को वेबसाइट बनने तक एक विशेष अवधि के लिए प्रतीक्षा करनी पड़ती है।
  • सीमित कार्यात्मकताएं और सुविधाएं।
  • डेटा की अनुपलब्धता के कारण, संगठनों में कई प्रमुख परियोजनाओं के पूरा होने की अवधि लंबी हो जाती है और इसलिए कंपनियों को गंभीर परिस्थितियों से गुजरना पड़ता है।

निष्कर्ष

इसलिए, डेटा की कई प्रतियों के कारण हार्डवेयर विफलता के बावजूद Hadoop डेटा अत्यधिक उपलब्ध और सुलभ है। इसलिए, यदि कोई नोड या मशीन क्रैश हो जाती है या नीचे चली जाती है, तो डेटा हम दूसरे पथ से डेटा तक पहुंच सकते हैं। अधिक जानें एचडीएफएस सुविधाएं।

यदि आपको यह ब्लॉग हडूप उच्च उपलब्धता पर मददगार लगता है, तो कृपया अपने विचार टिप्पणी अनुभाग में साझा करें।


  1. Redis
  2.   
  3. MongoDB
  4.   
  5. Memcached
  6.   
  7. HBase
  8.   
  9. CouchDB
  1. Cloudera प्रतिकृति प्लगइन Apache HBase के लिए x-प्लेटफ़ॉर्म प्रतिकृति को सक्षम करता है

  2. Apache HBase स्नैपशॉट का परिचय, भाग 2:गहरा गोता

  3. HBase:कम मेमोरी पर चलने के लिए 5 युक्तियाँ EC2

  4. Apache HBase प्रतिकृति:परिचालन अवलोकन

  5. स्टॉक डेटा की भविष्यवाणी करने वाले एप्लिकेशन बनाने के लिए COD और CML का उपयोग करना