MongoDB
 sql >> डेटाबेस >  >> NoSQL >> MongoDB

काफ्का-स्पार्क संरचित स्ट्रीमिंग का उपयोग करके MongoDB को डेटा भेजने में असमर्थ

त्रुटि के अनुसार, आपके पास पहले से ही एक स्ट्रिंग है, (आप पहले ही df.selectExpr("CAST(value AS STRING)") कर चुके हैं ), इसलिए आपको Row ईवेंट को String . के रूप में प्राप्त करने का प्रयास करना चाहिए , न कि Array[Byte]

. बदलकर प्रारंभ करें
val valueStr = new String(record.getAs[Array[Byte]]("value"))

करने के लिए

val valueStr = record.getAs[String]("value")

मैं समझता हूं कि स्पार्क कोड चलाने के लिए आपके पास पहले से ही एक क्लस्टर हो सकता है, लेकिन मेरा सुझाव है कि अभी भी देखें। काफ्का कनेक्ट मोंगो सिंक कनेक्टर ताकि आपको अपने स्वयं के Mongo लेखक को Spark कोड में लिखने और बनाए रखने की आवश्यकता न पड़े।

या, आप स्पार्क डेटासेट को सीधे mongo में भी लिख सकते हैं




  1. Redis
  2.   
  3. MongoDB
  4.   
  5. Memcached
  6.   
  7. HBase
  8.   
  9. CouchDB
  1. स्प्रिंग डेटा MongoDB - $eq $project समर्थन के भीतर

  2. PHP MongoDB मानचित्र db अभिकथन विफलता को कम करता है

  3. MongoDB उच्चतम मिलान द्वारा उत्पाद खोज क्रम को प्रतिस्थापित करता है

  4. लूप के बिना ईमेल जैसे अद्वितीय आईडी द्वारा विभिन्न मूल्यों के साथ नेवला अद्यतन कई

  5. फ़ाइल भंडारण के रूप में MongoDB