मेरा उत्तर Hadoop MR के ज्ञान और अनुभव और Mongo DB MR के सीखने पर आधारित है। आइए देखें कि प्रमुख अंतर क्या हैं और फिर चयन के लिए मानदंड परिभाषित करने का प्रयास करें:अंतर हैं:
- Hadoop का MR जावा में लिखा जा सकता है, जबकि MongoDB जावास्क्रिप्ट में है।
- Hadoop का MR सभी कोर का उपयोग करने में सक्षम है, जबकि MongoDB सिंगल थ्रेडेड है।
- Hadoop MR को डेटा के साथ नहीं जोड़ा जाएगा, जबकि Mongo DB का कोलोकेशन किया जाएगा।
- Hadoop MR में लाखों इंजन/घंटे हैं और बड़े आकार के आउटपुट, डेटा स्क्यूज़ आदि के साथ कई कोने के मामलों का सामना कर सकते हैं
- सुअर, हाइव, कैस्केडिंग जैसे उच्च स्तर के ढांचे हडूप एमआर इंजन के शीर्ष पर बनाए गए हैं।
- Hadoop MR मुख्य धारा है और ढेर सारे सामुदायिक समर्थन उपलब्ध हैं।
ऊपर से मैं चयन के लिए निम्नलिखित मानदंड सुझा सकता हूं:
मोंगो डीबी एमआर का चयन करें यदि आपको सरल समूह और फ़िल्टरिंग की आवश्यकता है, तो मानचित्र के बीच भारी फेरबदल की अपेक्षा न करें और कम करें। दूसरे शब्दों में - कुछ सरल।
हडूप एमआर का चयन करें यदि आप जटिल, कम्प्यूटेशनल रूप से गहन एमआर जॉब करने जा रहे हैं (उदाहरण के लिए कुछ रिग्रेशन गणना)। मैप और रिड्यूस के बीच बहुत अधिक या अप्रत्याशित आकार का डेटा होना भी Hadoop MR का सुझाव देता है।
जावा अधिक पुस्तकालयों के साथ एक मजबूत भाषा है, विशेष रूप से सांख्यिकीय। इसे ध्यान में रखा जाना चाहिए।