MongoDB डेटा को एक पूरी तरह से अलग प्रारूप में संग्रहीत करता है, जिसे BSON कहा जाता है, जो अधिक डिस्क स्थान लेने वाला है। न केवल प्रत्येक फ़ील्ड के लिए मानों को संग्रहीत करने की आवश्यकता है, बल्कि प्रत्येक दस्तावेज़ (पंक्ति) में कॉलम नामों को फिर से संग्रहीत करना होगा। यदि आपके पास बड़े कॉलम नाम हैं, तो यह निश्चित रूप से MongoDB में आपकी CSV फ़ाइल के आकार को 8 से 10 गुना तक बढ़ा सकता है। यदि संभव हो, तो आप अपने क्षेत्र के नामों को छोटा करने पर विचार कर सकते हैं यदि यह आपके लिए बहुत अधिक है।
MongoDB प्रीआलोकेट करता है आपके लिए डेटा फ़ाइलें। उदाहरण के लिए, जिस क्षण यह taq.2
. में डेटा जोड़ना शुरू करता है , यह taq.3
. बनाएगा , और इसी तरह जब यह taq.4
. में लिखना शुरू करता है यह tag.5
. बनाता है . तो आपके मामले में, मान लें कि आपकी 230MB फ़ाइल 1.9GB डेटा बनाएगी, MongoDB ने पहले ही 2.0G आकार taq.5
आवंटित कर दिया है . --noprealloc
. निर्दिष्ट करके इस व्यवहार को बंद किया जा सकता है mongod
starting प्रारंभ करते समय कमांड लाइन पर ।