आप UTF-8 को यूनिकोड के साथ भ्रमित कर रहे हैं।
0x00FC यूनिकोड . है ü:
. के लिए कोड बिंदुmysql> select char(0x00FC using ucs2);
+----------------------+
| char(0x00FC using ucs2) |
+----------------------+
| ü |
+----------------------+
UTF-8 . में एन्कोडिंग, 0x00FC दो बाइट्स द्वारा दर्शाया गया है :
mysql> select char(0xC3BC using utf8);
+-------------------------+
| char(0xC3BC using utf8) |
+-------------------------+
| ü |
+-------------------------+
UTF-8 केवल एन्कोडिंग का एक तरीका है बाइनरी रूप में यूनिकोड वर्ण। यह अंतरिक्ष कुशल होने के लिए है, यही कारण है कि ASCII वर्ण केवल एक बाइट लेते हैं, और iso-8859-1 वर्ण जैसे ü केवल दो बाइट लेते हैं। कुछ अन्य पात्र तीन या चार बाइट लेते हैं, लेकिन वे बहुत कम आम हैं।