MongoDB
 sql >> डेटाबेस >  >> NoSQL >> MongoDB

स्पार्क कार्य निष्पादित नहीं कर रहा है

अगर कोई मेरी तरह इस पर ठोकर खाता है और क्लस्टर पर काम कर रहा है, लेकिन लक्ष्य नोड पर कुछ स्थानीय स्क्रिप्ट चलाने की आवश्यकता के साथ

समाधान

सबसे आसान फुलप्रूफ समाधान स्क्रिप्ट की शुरुआत में PYSPARK_PYTHON env सेट करना होगा, क्योंकि मेरे मामले में pyspark-shell इसे ठीक से कॉन्फ़िगर नहीं कर सका, भले ही $SPARK_HOME/conf/spark-env.sh में ठीक से कॉन्फ़िगर किया गया हो। या यहां तक ​​कि spark-defaults.conf . में भी और ~/.bashrc (दोनों पहले विकल्प से कम वांछनीय)।

import os
os.environ['PYSPARK_PYTHON'] = '/path/to/python3' # Worker executable
os.environ['PYSPARK_DRIVER_PYTHON'] = '/path/to/python3' # Driver executable

संभावित कारण

मुझे पूरी तरह से यकीन नहीं है, लेकिन मेरा अनुमान है कि आपके वेनव में पाइप से स्थापित पाइस्पार्क उस से अलग है जो वास्तव में स्पार्क द्वारा ही लोड किया गया है और यह सही एनवी चर नहीं ढूंढता है, इसे कॉन्फ़िगर करने के बावजूद डिफ़ॉल्ट पायथन 2.7 निष्पादन योग्य का सहारा लेता है। हर जगह।



  1. Redis
  2.   
  3. MongoDB
  4.   
  5. Memcached
  6.   
  7. HBase
  8.   
  9. CouchDB
  1. mongoDB एकत्रीकरण में $ मैच के भीतर $cond का उपयोग करें

  2. MongoDB मल्टीकी इंडेक्स और इंडेक्स इंटरसेक्शन बाउंड्स

  3. सर्वर से कनेक्ट नहीं हो सका 127.0.0.1 shell/mongo.js

  4. कुप्पी mongoengine uri . के माध्यम से कनेक्ट

  5. डेटाबेस से JSON को संग्रहीत करना और क्वेरी करना