HBase
 sql >> डेटाबेस >  >> NoSQL >> HBase

बिग डेटा हडूप की शीर्ष 10 विशेषताएं

इस हडूप ट्यूटोरियल में, हम हडूप की 10 सर्वश्रेष्ठ विशेषताओं पर चर्चा करेंगे। यदि आप Apache Hadoop से परिचित नहीं हैं, तो आप हमारे Hadoop परिचय . का संदर्भ ले सकते हैं Apache Hadoop ढांचे का विस्तृत ज्ञान प्राप्त करने के लिए ब्लॉग।

इस ब्लॉग में, हम बड़े डेटा Hadoop की सबसे महत्वपूर्ण विशेषताओं जैसे Hadoop फॉल्ट टॉलरेंस, Hadoop में वितरित प्रसंस्करण, स्केलेबिलिटी पर जा रहे हैं। विश्वसनीयता Hadoop में उच्च उपलब्धता, आर्थिक, लचीलापन, डेटा स्थान।

Hadoop परिचय

Hadoop एक खुला स्रोत सॉफ्टवेयर ढांचा है जो बड़ी मात्रा में डेटा सेट के वितरित भंडारण और प्रसंस्करण का समर्थन करता है। यह अपनी विशेषताओं के कारण बाजार में सबसे शक्तिशाली बिग डेटा टूल है। दोष सहिष्णुता, विश्वसनीयता, उच्च उपलब्धता आदि जैसी विशेषताएं।

Hadoop प्रदान करता है-

  • एचडीएफएस  - विश्व की सबसे विश्वसनीय संग्रहण परत
  • MapReduce  - वितरित प्रसंस्करण परत
  • यार्न  - संसाधन प्रबंधन परत

बिग डेटा Hadoop की महत्वपूर्ण विशेषताएं

Apache Hadoop द्वारा प्रदान की जाने वाली बहुत सारी सुविधाएँ हैं। आइए Hadoop की इन विशेषताओं के बारे में विस्तार से चर्चा करें।

ए. खुला स्रोत

यह एक खुला स्रोत जावा-आधारित प्रोग्रामिंग ढांचा है। ओपन सोर्स का मतलब है कि यह स्वतंत्र रूप से उपलब्ध है और यहां तक ​​कि हम आपकी आवश्यकताओं के अनुसार इसके सोर्स कोड को भी बदल सकते हैं।

<एच4>बी. दोष सहिष्णुता

Hadoop प्रतिकृति निर्माण की प्रक्रिया द्वारा दोषों को नियंत्रित करता है। जब क्लाइंट एचडीएफएस में फाइल स्टोर करता है, तो हडूप फ्रेमवर्क फाइल को ब्लॉक में विभाजित करता है। फिर क्लाइंट एचडीएफएस क्लस्टर में मौजूद विभिन्न मशीनों में डेटा ब्लॉक वितरित करता है।

और, फिर क्लस्टर में मौजूद अन्य मशीनों पर प्रत्येक ब्लॉक की प्रतिकृति बनाएं। एचडीएफएस, डिफ़ॉल्ट रूप से, क्लस्टर में मौजूद अन्य मशीनों पर ब्लॉक की 3 प्रतियां बनाता है।

यदि क्लस्टर में कोई मशीन प्रतिकूल परिस्थितियों के कारण खराब हो जाती है या विफल हो जाती है। फिर भी, उपयोगकर्ता उस डेटा को अन्य मशीनों से आसानी से एक्सेस कर सकता है।

सी. वितरित संसाधन

Hadoop HDFS में वितरित तरीके से बड़ी मात्रा में डेटा संग्रहीत करता है। डेटा को नोड्स के समूह पर समानांतर में संसाधित करें।

<एच4>डी. मापनीयता  

Hadoop एक ओपन सोर्स प्लेटफॉर्म है। यह इसे बेहद स्केलेबल प्लेटफॉर्म बनाता है। तो, नए नोड्स को बिना किसी डाउनटाइम के आसानी से जोड़ा जा सकता है। Hadoop क्षैतिज मापनीयता प्रदान करता है इसलिए सिस्टम में फ्लाई मॉडल पर नया नोड जोड़ा जाता है। Apache Hadoop में, एप्लिकेशन हजारों से अधिक नोड पर चलते हैं।

ई. विश्वसनीयता

डेटा की प्रतिकृति के कारण मशीन की विफलता के बावजूद डेटा को मशीनों के क्लस्टर पर मज़बूती से संग्रहीत किया जाता है। इसलिए, यदि कोई भी नोड विफल हो जाता है, तो भी हम डेटा को मज़बूती से संग्रहीत कर सकते हैं।

<एच4>एफ. उच्च उपलब्धता

डेटा की कई प्रतियों के कारण, हार्डवेयर विफलता के बावजूद डेटा अत्यधिक उपलब्ध और सुलभ है। तो, कोई भी मशीन डाउन हो जाती है डेटा दूसरे पथ से पुनर्प्राप्त किया जा सकता है। Hadoop उच्च उपलब्धता सुविधा को विस्तार से जानें।

<एच4>जी. आर्थिक

Hadoop बहुत महंगा नहीं है क्योंकि यह कमोडिटी हार्डवेयर के क्लस्टर पर चलता है। चूंकि हम कम लागत वाले कमोडिटी हार्डवेयर का उपयोग कर रहे हैं, इसलिए हमें आपके Hadoop क्लस्टर को बढ़ाने के लिए बड़ी राशि खर्च करने की आवश्यकता नहीं है।

मैं. लचीलापन

Hadoop सभी प्रकार के डेटा से निपटने की क्षमता के मामले में बहुत लचीला है। यह संरचित, अर्ध-संरचित या असंरचित से संबंधित है।

जे. उपयोग में आसान

वितरित कंप्यूटिंग से निपटने के लिए क्लाइंट की कोई आवश्यकता नहीं है, ढांचा सभी चीजों का ख्याल रखता है। इसलिए इसका उपयोग करना आसान है।

<एच4>के. डेटा स्थान

यह गणना को उस स्थान के करीब ले जाने की क्षमता को संदर्भित करता है जहां वास्तविक डेटा नोड पर रहता है। डेटा को गणना में ले जाने के बजाय। यह नेटवर्क की भीड़ को कम करता है और सिस्टम के ओवर थ्रूपुट को बढ़ाता है। डेटा स्थान के बारे में अधिक जानें।

निष्कर्ष

अंत में, हम कह सकते हैं, Hadoop अत्यधिक दोष-सहिष्णु है। यह हार्डवेयर की विफलता के बावजूद बड़ी मात्रा में डेटा को मज़बूती से संग्रहीत करता है। यह उच्च मापनीयता और उच्च उपलब्धता प्रदान करता है।

Hadoop लागत प्रभावी है क्योंकि यह कमोडिटी हार्डवेयर के क्लस्टर पर चलता है। डेटा इलाके पर हडूप काम करता है क्योंकि चलती गणना चलती डेटा से सस्ता है। बिग डेटा हडूप की ये सभी विशेषताएं इसे बिग डेटा प्रोसेसिंग के लिए शक्तिशाली बनाती हैं।


  1. Redis
  2.   
  3. MongoDB
  4.   
  5. Memcached
  6.   
  7. HBase
  8.   
  9. CouchDB
  1. एचडीएफएस ट्यूटोरियल - शुरुआती के लिए एचडीएफएस का पूरा परिचय

  2. Hadoop HDFS में NameNode स्वचालित विफलता क्या है?

  3. अपाचे HBase लिखें पथ

  4. CDH 6.2 रिलीज़:HBase में नया क्या है?

  5. Hadoop उच्च उपलब्धता सुविधा को समझना