PostgreSQL
 sql >> डेटाबेस >  >> RDS >> PostgreSQL

PostgreSQL से कनेक्ट करने के लिए pyspark का उपयोग करना

https://jdbc.postgresql.org/download.html

से PostgreSQL JDBC ड्राइवर डाउनलोड करें

फिर डेटाबेस कॉन्फ़िगरेशन मानों को अपने द्वारा बदलें।

from pyspark.sql import SparkSession

spark = SparkSession \
    .builder \
    .appName("Python Spark SQL basic example") \
    .config("spark.jars", "/path_to_postgresDriver/postgresql-42.2.5.jar") \
    .getOrCreate()

df = spark.read \
    .format("jdbc") \
    .option("url", "jdbc:postgresql://localhost:5432/databasename") \
    .option("dbtable", "tablename") \
    .option("user", "username") \
    .option("password", "password") \
    .option("driver", "org.postgresql.Driver") \
    .load()

df.printSchema()

अधिक जानकारी:https://spark.apache.org/docs/latest/sql-data-sources-jdbc.html



  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. कैसे विशाल तालिका से सभी पंक्तियों को पढ़ने के लिए?

  2. PostgreSQL दिनांक और समय कार्य

  3. ON CONFLICT से मेल खाने वाली कोई अनूठी या बहिष्करण बाधा नहीं है

  4. MigrationSchemaMissing(django_migrations तालिका बनाने में असमर्थ (%s) % exc)

  5. org.postgresql.util.PSQLException:FATAL:क्षमा करें, पहले से ही बहुत सारे ग्राहक हैं