संयोजन आपकी चिंता कम से कम है, आपको चरित्र सेट . के बारे में सोचने की आवश्यकता है कॉलम/टेबल/डेटाबेस के लिए। कोलेशन (डेटा को तुलना कैसे नियंत्रित करता है, इसे नियंत्रित करने वाले नियम और क्रमबद्ध ) उसी का एक परिणाम है।
MySQL कई यूनिकोड वर्ण सेटों का समर्थन करता है, utf8
और utf8mb4
सबसे दिलचस्प होने के नाते। utf8
BMP
में यूनिकोड वर्णों का समर्थन करता है , यानी सभी यूनिकोड का सबसेट। utf8mb4
, MySQL 5.5.3 के बाद से उपलब्ध, सभी . का समर्थन करता है यूनिकोड का।
संयोजन किसी भी यूनिकोड एन्कोडिंग के साथ उपयोग किए जाने की सबसे अधिक संभावना है xxx_general_ci
या xxx_unicode_ci
. पूर्व भाषा से स्वतंत्र एक सामान्य छँटाई और तुलना एल्गोरिथ्म है, बाद वाला एक अधिक पूर्ण . है भाषा स्वतंत्र एल्गोरिथम अधिक यूनिकोड सुविधाओं का समर्थन करता है (उदाहरण के लिए "ß" और "ss" को समकक्ष मानते हुए), लेकिन इसलिए यह धीमा भी है।
देखें https://dev.mysql.com/ doc/refman/5.5/hi/charset-unicode-sets.html ।