मुझे लगता है कि मुझे यह समस्या मिल गई है:mongodb-hadoop में अपने BSON एन्कोडर/डिकोडर उदाहरणों पर core/src/main/java/com/mongodb/hadoop/input/MongoInputSplit.java में एक "स्थैतिक" संशोधक है। जब स्पार्क मल्टीथ्रेडेड मोड में चलता है तो सभी थ्रेड समान . का उपयोग करके कोशिश करते हैं और डिसेरिएलाइज करते हैं एन्कोडर/डिकोडर इंस्टेंसेस, जिनके अनुमानित रूप से खराब परिणाम हैं।
मेरे जीथब पर पैच यहां (अपस्ट्रीम में एक पुल अनुरोध सबमिट किया है)
मैं अब पाइथन से 8 कोर मल्टीथ्रेडेड स्पार्क-> मोंगो संग्रह गिनती() चलाने में सक्षम हूं!