Mysql
 sql >> डेटाबेस >  >> RDS >> Mysql

एडब्ल्यूएस गोंद प्रेडिकेट पुश डाउन कंडीशन का कोई प्रभाव नहीं पड़ता है

पुशडाउन विधेय केवल कॉलम को विभाजित करने के लिए काम करता है। दूसरे शब्दों में, आपकी डेटा फ़ाइलों को पदानुक्रम से संरचित फ़ोल्डरों में रखा जाना चाहिए। उदाहरण के लिए, यदि डेटा s3://bucket/dataset/ . में स्थित है और वर्ष, महीने और दिन के अनुसार विभाजित किया जाए तो संरचना निम्नलिखित होनी चाहिए:

s3://bucket/dataset/year=2018/month=7/day=18/<data-files-here>

ऐसे मामले में पुशडाउन विधेय year columns कॉलम के लिए काम करेगा , month और day केवल:

datasource = glueContext.create_dynamic_frame_from_catalog(
    database = source_catalog_db, 
    table_name = source_catalog_tbl, 
    push_down_predicate = "year = 2017 and month > 6 and day between 3 and 10", 
    transformation_ctx = "datasource")

इसके अलावा आपको यह ध्यान रखना होगा कि पुशडाउन केवल s3 डेटा स्रोतों के साथ काम करता है।

यहाँ एक अच्छा ब्लॉग पोस्ट है डेटा विभाजन के बारे में AWS Glue devs द्वारा लिखा गया है।



  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. छोटी पीएनजी छवियों को संग्रहीत करने के लिए MySQL BLOB बनाम फ़ाइल?

  2. एसक्यूएल वाक्य रचना में mysql गिनती शब्द

  3. PHP में कुछ OR DIE () कैसे काम करता है?

  4. UTF-8 कॉलम के लिए SQLAlchemy परिणाम 'str' प्रकार का है, क्यों?

  5. सभी उत्पादों, श्रेणियों और मेटा डेटा प्राप्त करने के लिए SQL क्वेरी woocommerce/wordpress