मुख्य अंतर छँटाई सटीकता (भाषा में वर्णों की तुलना करते समय) और प्रदर्शन है। एकमात्र विशेष utf8_bin है जो बाइनरी प्रारूप में वर्णों की तुलना करने के लिए है।
utf8_general_ci
utf8_unicode_ci
. से कुछ तेज़ है , लेकिन कम सटीक (छँटाई के लिए)। विशिष्ट भाषा utf8 एन्कोडिंग (जैसे utf8_swedish_ci
) में अतिरिक्त भाषा नियम होते हैं जो उन्हें उन भाषाओं के लिए क्रमबद्ध करने के लिए सबसे सटीक बनाते हैं। अधिकांश समय मैं utf8_unicode_ci
. का उपयोग करता हूं (मैं छोटे प्रदर्शन सुधारों के लिए सटीकता पसंद करता हूं), जब तक कि मेरे पास किसी विशिष्ट भाषा को पसंद करने का कोई अच्छा कारण न हो।
आप MySQL मैनुअल पर विशिष्ट यूनिकोड वर्ण सेट पर अधिक पढ़ सकते हैं - http://dev.mysql.com/doc/refman/5.0/en/charset-unicode-sets.html