Easysoft JDBC-ODBC ब्रिज के साथ Talend का परीक्षण करते समय, हमने SQL सर्वर डेटाबेस से CSV प्रारूप फ़ाइल में गैर-ASCII डेटा लिखते समय टेक्स्ट भ्रष्टाचार का अनुभव किया।
समाधान एक String
. से Talend स्कीमा में समस्या स्तंभ के लिए डेटा प्रकार को बदलना था एक byte[]
. के लिए . ऐसा करने के लिए, हम:
- tJDBCInput कॉम्पोनेंट की प्रॉपर्टी एक्सेस की।
- स्कीमा संपादित करें बटन चुनें।
- प्रासंगिक कॉलम के लिए डेटा प्रकार की परिभाषा बदली।
टैलेंड का डिफ़ॉल्ट वर्ण एन्कोडिंग UTF-8 है। जब तक JDBC ड्राइवर द्वारा लौटाया गया डेटा ASCII है, तब तक भिन्न वर्ण एन्कोडिंग के साथ एन्कोड किया गया डेटा कोई समस्या नहीं है:UTF-8 डेटा जिसमें केवल ASCII वर्ण होते हैं, डेटा के समान होता है।