PostgreSQL
 sql >> डेटाबेस >  >> RDS >> PostgreSQL

Pyspark ipython नोटबुक में डेटाबेस पोस्टग्रेज करने के लिए कनेक्शन

मुझे यकीन नहीं है कि उपरोक्त उत्तर मेरे लिए क्यों काम नहीं करता है, लेकिन मैंने सोचा कि मैं ज्यूपिटर नोटबुक (स्पार्क 2.3.1 - पायथन 3.6.3) से पाइस्पार्क चलाते समय वास्तव में मेरे लिए क्या काम कर सकता हूं, साझा कर सकता हूं:

from pyspark.sql import SparkSession
spark = SparkSession.builder.config('spark.driver.extraClassPath', '/path/to/postgresql.jar').getOrCreate()
url = 'jdbc:postgresql://host/dbname'
properties = {'user': 'username', 'password': 'pwd'}
df = spark.read.jdbc(url=url, table='tablename', properties=properties)


  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. पोस्टग्रेज स्थानीय विकास डीबी में हेरोकू प्रोडक्शन डीबी की प्रतिलिपि बनाते हैं

  2. INSERT / UPDATE / DELETE ऑपरेशन को ऑप्टिमाइज़ करें

  3. Postgres में किसी सरणी स्तंभ के प्रत्येक तत्व के लिए फ़ंक्शन कैसे लागू करें?

  4. वस्तुओं की संपत्ति द्वारा किसी जेसन या जेसनबी मान के अंदर किसी सरणी में ऑब्जेक्ट्स को कैसे सॉर्ट करें?

  5. फ़ंक्शन में कॉलम की गतिशील संख्या कैसे लौटाएं?