हां यह सही है। UTF-8 यूनिकोड वर्ण सेट के लिए एक एन्कोडिंग है, जो दुनिया की हर भाषा का बहुत अधिक समर्थन करता है।
मुझे लगता है कि केवल अंतर आपके परिणामों को क्रमबद्ध करने के साथ आता है, अन्य भाषाओं में अलग-अलग अक्षर अलग-अलग क्रम में आ सकते हैं (उच्चारण, उमलॉट, आदि)। साथ ही, a
. की तुलना करना करने के लिए ä
दूसरे संयोजन में अलग तरह से व्यवहार कर सकता है।
_ci
प्रत्यय का अर्थ है छँटाई और तुलना होती है c ऐस i असंवेदनशील।
http://www.collation-charts.org/ आपकी रुचि हो सकती है।