MongoDB
 sql >> डेटाबेस >  >> NoSQL >> MongoDB

com.mongodb.spark.exceptions.MongoTypeConversionException को कैसे हल करें:कास्ट नहीं किया जा सकता... जावा स्पार्क

मुझे भी यही समस्या थी और नमूना आकार आंशिक रूप से इस समस्या को ठीक करता है, लेकिन यदि आपके पास बहुत अधिक डेटा है तो इसे हल नहीं करता है।

यहां समाधान है कि आप इसे कैसे ठीक कर सकते हैं। बढ़े हुए नमूना आकार . के साथ इस दृष्टिकोण का उपयोग करें (मेरे मामले में यह 100000 है):

def fix_schema(schema: StructType) -> StructType:
    """Fix spark schema due to inconsistent MongoDB schema collection.

    It fixes such issues like:
        Cannot cast STRING into a NullType
        Cannot cast STRING into a StructType

    :param schema: a source schema taken from a Spark DataFrame to be fixed
    """
    if isinstance(schema, StructType):
        return StructType([fix_schema(field) for field in schema.fields])
    if isinstance(schema, ArrayType):
        return ArrayType(fix_schema(schema.elementType))
    if isinstance(schema, StructField) and is_struct_oid_obj(schema):
        return StructField(name=schema.name, dataType=StringType(), nullable=schema.nullable)
    elif isinstance(schema, StructField):
        return StructField(schema.name, fix_schema(schema.dataType), schema.nullable)
    if isinstance(schema, NullType):
        return StringType()
    return schema


def is_struct_oid_obj(struct_field: StructField) -> bool:
    """
    Checks that our schema has StructType field with single oid name inside

    :param struct_field: a StructField from Spark schema
    :return bool
    """
    return (isinstance(struct_field.dataType, StructType)
            and len(struct_field.dataType.fields) == 1
            and struct_field.dataType.fields[0].name == "oid")


  1. Redis
  2.   
  3. MongoDB
  4.   
  5. Memcached
  6.   
  7. HBase
  8.   
  9. CouchDB
  1. मोंगोडीबी $anyElementTrue

  2. नोडजेएस का उपयोग करके ग्रिडएफएस में सहेजी गई फ़ाइल को कैसे डाउनलोड करें

  3. सार्वजनिक बादलों पर MongoDB प्रदर्शन की तुलना करना:AWS, Azure और DigitalOcean

  4. मोंगोडीबी $strLenBytes

  5. स्प्रिंग बूट और मोंगो डीबी में कनेक्शन पूलिंग