Mysql
 sql >> डेटाबेस >  >> RDS >> Mysql

500GB SQL टेबल को Apache Parquet में कैसे बदलें?

ऐसा करने के लिए Apache Spark का उपयोग किया जा सकता है:

1.load your table from mysql via jdbc
2.save it as a parquet file

उदाहरण:

from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
df = spark.read.jdbc("YOUR_MYSQL_JDBC_CONN_STRING",  "YOUR_TABLE",properties={"user": "YOUR_USER", "password": "YOUR_PASSWORD"})
df.write.parquet("YOUR_HDFS_FILE")


  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. java.sql.SQLException:कोई डेटाबेस नहीं चुना गया

  2. Play Framework Anorm &DB हल नहीं हुआ

  3. जब अन्य उपयोगकर्ता परिवर्तन करते हैं तो विंडोज प्रोग्राम को रिफ्रेश करना?

  4. बड़ी संख्या में mysql अपडेट और इंसर्ट को तेज करना

  5. ग्रुप बाय के दौरान समूह के भीतर संचालन