चरित्र सेट के रूप में, यदि आप कर सकते हैं, निश्चित रूप से यूटीएफ -8।
संयोजन के रूप में - यह विशेष वर्णों वाली भाषाओं के लिए थोड़ा बुरा है। विभिन्न प्रकार के संयोजन हैं। वे सभी सभी उमलॉट्स और अन्य पात्रों को स्टोर कर सकते हैं, लेकिन वे तुलना में उमलॉट्स के साथ कैसे व्यवहार करते हैं, यानी
में भिन्न हैं।u = ü
सच है या झूठा है; और छँटाई में (जहाँ अक्षर में Umlauts छँटाई क्रम में स्थित हैं)।
एक लंबी कहानी को छोटा करने के लिए, आपका सबसे अच्छा दांव या तो है
utf8_unicode_ci
यह केस असंवेदनशील खोजों की अनुमति देता है; यह ß
. व्यवहार करता है ss
. के रूप में और DIN-1 छँटाई का उपयोग करता है। अफसोस की बात है कि सभी गैर-बाइनरी यूनिकोड कोलाजेशन की तरह, यह u = ü
. को ट्रीट करता है जो एक भयानक उपद्रव है क्योंकि "मुलर" की खोज "मुलर" भी वापस कर देगी। आपको वास्तविक समय में एक उमलौत-जागरूक संयोजन स्थापित करके उसके आसपास काम करना होगा।
या utf8_bin
इस संयोजन में u = ü
. नहीं है समस्या है लेकिन केवल केस संवेदनशील खोज संभव है।
मुझे पूरी तरह से यकीन नहीं है कि बाइनरी संयोजन का उपयोग करने के लिए कोई अन्य दुष्प्रभाव हैं या नहीं; मैंने उस बारे में एक प्रश्न पूछा था यहां ए> ।
यह mySQL मैन्युअल पेज विभिन्न संयोजनों और उनके दैनिक उपयोग में आने वाले परिणामों पर एक अच्छा अवलोकन देता है।
यहां mySQL में उपलब्ध कॉलेशन पर एक सामान्य अवलोकन है।