संयोजन आपकी चिंता कम से कम है, आपको चरित्र सेट . के बारे में सोचने की आवश्यकता है कॉलम/टेबल/डेटाबेस के लिए। कोलेशन (डेटा को तुलना कैसे नियंत्रित करता है, इसे नियंत्रित करने वाले नियम और क्रमबद्ध ) उसी का एक परिणाम है।
MySQL कई यूनिकोड वर्ण सेटों का समर्थन करता है, utf8 और utf8mb4 सबसे दिलचस्प होने के नाते। utf8 BMP
में यूनिकोड वर्णों का समर्थन करता है , यानी सभी यूनिकोड का सबसेट। utf8mb4 , MySQL 5.5.3 के बाद से उपलब्ध, सभी . का समर्थन करता है यूनिकोड का।
संयोजन किसी भी यूनिकोड एन्कोडिंग के साथ उपयोग किए जाने की सबसे अधिक संभावना है xxx_general_ci या xxx_unicode_ci . पूर्व भाषा से स्वतंत्र एक सामान्य छँटाई और तुलना एल्गोरिथ्म है, बाद वाला एक अधिक पूर्ण . है भाषा स्वतंत्र एल्गोरिथम अधिक यूनिकोड सुविधाओं का समर्थन करता है (उदाहरण के लिए "ß" और "ss" को समकक्ष मानते हुए), लेकिन इसलिए यह धीमा भी है।
देखें https://dev.mysql.com/ doc/refman/5.5/hi/charset-unicode-sets.html ।