स्पार्क स्वयं Hadoop पर निर्भरता लेता है और HDFS में डेटा को डेटा स्रोत के रूप में उपयोग किया जा सकता है।
हालांकि, अगर आप Mongo Spark Connector का इस्तेमाल करते हैं आप Hadoop से गुजरे बिना MongoDB को स्पार्क के डेटा स्रोत के रूप में उपयोग कर सकते हैं।