PostgreSQL
 sql >> डेटाबेस >  >> RDS >> PostgreSQL

स्पार्क से पोस्टग्रेज में विश्लेषणात्मक डेटा सम्मिलित करना

फिलहाल किसी भी डीबीएमएस को आरडीडी लिखने का कोई मूल कार्यान्वयन नहीं है। स्पार्क उपयोगकर्ता सूची में संबंधित चर्चाओं के लिंक यहां दिए गए हैं:एक , दो

सामान्य तौर पर, सबसे अधिक प्रदर्शन करने वाला दृष्टिकोण निम्नलिखित होगा:

  1. RDD में विभाजनों की संख्या की पुष्टि करें, यह बहुत कम और बहुत अधिक नहीं होना चाहिए। संख्या कम होने पर 20-50 विभाजन ठीक होना चाहिए - repartition call पर कॉल करें 20 विभाजनों के साथ, यदि उच्चतर हो - coalesce . पर कॉल करें 50 विभाजनों तक
  2. mapPartitionको कॉल करें परिवर्तन, इसके अंदर जेडीबीसी का उपयोग करके अपने डीबीएमएस में रिकॉर्ड डालने के लिए फ़ंक्शन को कॉल करें। इस फ़ंक्शन में आप अपने डेटाबेस से कनेक्शन खोलते हैं और COPY कमांड का उपयोग यह एपीआई , यह आपको प्रत्येक रिकॉर्ड के लिए एक अलग कमांड की आवश्यकता को समाप्त करने की अनुमति देगा - इस तरह से इंसर्ट को बहुत तेजी से संसाधित किया जाएगा

इस तरह आप 50 समानांतर कनेक्शन (आपके स्पार्क क्लस्टर आकार और इसके कॉन्फ़िगरेशन पर निर्भर करता है) का उपयोग करके समानांतर फैशन में डेटा को पोस्टग्रेज में सम्मिलित करेंगे। आरडीडी और कनेक्शन स्ट्रिंग को स्वीकार करने वाले जावा/स्कैला फ़ंक्शन के रूप में संपूर्ण दृष्टिकोण लागू किया जा सकता है



  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. SQL में समवर्ती घटनाओं की संख्या की गणना करें

  2. काउंट सबक्वेरी, इनर जॉइन और ग्रुप के साथ क्वेरी

  3. एक ही घटना पर ट्रिगर से पहले और बाद में? चाइल्ड टेबल पोस्टग्रेएसक्यूएल भरें

  4. Postgresql में `tablefunc` क्वेरी में शून्य मान कैसे शामिल करें?

  5. क्या एलेम्बिक ऑटोजेनरेट कॉलम में बदलाव कर सकता है?