utf8
एक एन्कोडिंग है (बाइट्स की एक श्रृंखला के रूप में यूनिकोड वर्णों का प्रतिनिधित्व कैसे करें), एक संयोजन नहीं (कौन सा वर्ण किससे पहले जाता है)।
मुझे लगता है कि पोस्टग्रेस 10 कोलाज utf8_general_ci
. के बराबर है (या अधिक आधुनिक utf8_unicode_ci
) को und-x-icu
. कहा जाता है - यह एक अपरिभाषित संयोजन है (किसी भी वास्तविक दुनिया की भाषा के लिए परिभाषित नहीं) एक आईसीयू पुस्तकालय द्वारा प्रदान किया गया। यह संयोजन अधिकांश भाषाओं के काफी उचित वर्णों को क्रमबद्ध करेगा।
ICU समर्थन PostgreSQL 10 में जोड़ी गई एक नई सुविधा है, इसलिए यह संयोजन पुराने PostgreSQL संस्करणों के लिए या संकलन के दौरान अक्षम होने पर उपलब्ध नहीं है। इससे पहले Postgres ऑपरेटिंग सिस्टम का उपयोग कर रहा था, जो कोलेशन सपोर्ट प्रदान करता था, जो ऑपरेटिंग सिस्टम के बीच भिन्न होता है।