तो आप कहीं 100 अरब रिकॉर्ड (1 मिलियन रिकॉर्ड * 100,000 उपयोगकर्ता) के क्षेत्र में देख रहे हैं।
बड़ी मात्रा में डेटा से निपटने का पसंदीदा तरीका एक शार्प्ड क्लस्टर बनाना है जो डेटा को कई सर्वरों पर विभाजित करता है जो मोंगो क्लाइंट के माध्यम से एकल तार्किक इकाई के रूप में प्रस्तुत किए जाते हैं।
इसलिए आपके प्रश्न का उत्तर आपके सभी रिकॉर्ड को एक ही शार्प संग्रह में रख दिया गया है।
आवश्यक शार्क की संख्या और क्लस्टर का कॉन्फ़िगरेशन डेटा के आकार और अन्य कारकों जैसे कि मात्रा और पढ़ने और लिखने के वितरण से संबंधित है। उन सवालों के जवाब शायद आपकी अनूठी स्थिति के लिए बहुत विशिष्ट हैं, इसलिए मैं उनका अनुमान लगाने की कोशिश नहीं करूंगा।
मैं शायद यह तय करके शुरू करूंगा कि आपके पास कितनी मशीनों के क्लस्टर पर सिस्टम को स्थापित करने और परीक्षण करने के लिए समय और मशीनें उपलब्ध हैं। उसके प्रदर्शन के आधार पर, आप यह तय कर सकते हैं कि आपको अपने क्लस्टर में अधिक या कम शार्क चाहिए