MongoDB
 sql >> डेटाबेस >  >> NoSQL >> MongoDB

आउटपुट के रूप में mongoDB में mapReduce का उपयोग करके hdfs से संसाधित डेटा को कैसे स्टोर करें?

मूल रूप से आपको "आउटपुट प्रारूप वर्ग" को बदलने की आवश्यकता है, और आपके पास वहां कई तरीके हैं:

  1. Hadoop के लिए MongoDB कनेक्टर का उपयोग करें :http://docs.mongodb.org/ecosystem/tools /hadoop/?_ga=1.111209414.370990604.1441913822
  2. अपना खुद का आउटपुटफ़ॉर्मैट लागू करें :https://hadoop। apache.org/docs/r2.7.0/api/org/apache/hadoop/mapred/OutputFormat.html (इसके बजाय FileOutputFormat का उपयोग करने के लिए)।
  3. रेड्यूसर के अंदर मोंगोडब क्वेरी निष्पादित करें मैपरेडस संदर्भ में लिखने के बजाय (अच्छा नहीं, आप ड्राइवर में निर्दिष्ट आउटपुटफॉर्मेट के आधार पर एचडीएफएस में खाली आउटपुट फाइलों के साथ समाप्त कर सकते हैं)

मेरी राय में विकल्प 1 सबसे अच्छा विकल्प है, लेकिन मैंने यह कहने के लिए MongoDB कनेक्टर का उपयोग नहीं किया है कि क्या यह पर्याप्त स्थिर और कार्यात्मक है। विकल्प 2 के लिए आवश्यक है कि आप वास्तव में समझें कि बहुत सारे खुले कनेक्शन और लेन-देन और हडूप कार्यों के साथ समस्याओं के अंत से बचने के लिए अंडरहुड कैसे काम कर रहा है।




  1. Redis
  2.   
  3. MongoDB
  4.   
  5. Memcached
  6.   
  7. HBase
  8.   
  9. CouchDB
  1. डेटा को एक मॉडल से दो में विभाजित करने के बाद मैं अपनी नेवला क्वेरी को फिर से कैसे लिख सकता हूं?

  2. MongoDb:कैसे वस्तु संग्रह में अतिरिक्त वस्तु सम्मिलित करने के लिए?

  3. मोंगोडीबी $सेटडिफरेंस

  4. MongoDB प्रतिकृति सेट की स्थापना

  5. क्वेरी MongoDB केवल विशिष्ट घंटों में खोजें