Mysql
 sql >> डेटाबेस >  >> RDS >> Mysql

TimeStamp विभाजन कुंजी पर स्पार्क JoinWithCassandraTable STUCK

उपयोग करके:

sc.parallelize(startDate to endDate)

प्रारूप द्वारा दिनांकों से उत्पन्न प्रारंभ डेटा और समाप्ति दिनांक के रूप में:

("yyyy-MM-dd HH:mm:ss")

मैंने सी * टेबल के साथ जुड़ने के लिए एक विशाल सरणी (100,000+ ऑब्जेक्ट्स) बनाने के लिए स्पार्क बनाया और यह बिल्कुल अटक नहीं गया- सी * ने शामिल होने और डेटा वापस करने के लिए कड़ी मेहनत की।

अंत में, मैंने अपनी सीमा को इसमें बदल दिया:

case class TableKey(created_dh: String)
val data = Array("2015-10-29 12:00:00", "2015-10-29 13:00:00", "2015-10-29 14:00:00", "2015-10-29 15:00:00")
val snapshotsFiltered = sc.parallelize(data, 2).map(TableKey(_)).joinWithCassandraTable("listener","snapshots_tnew")

और अब ठीक है।




  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. MySQL के साथ ASP.NET MVC 4 EF5

  2. मैसकल:डेटाबेस में सभी क्षेत्रों को ट्रिम करें

  3. MySQL 8 पूर्णांक लंबाई को अनदेखा कर रहा है

  4. संचालन का MySQL आदेश?

  5. PHP/MySQL:बेस्ट मनी ऑपरेशंस/स्टोरिंग प्रैक्टिस?