tl;डॉ नहीं, वे मान्य नहीं हैं, जो कुछ भी एन्कोडिंग किया है वह या तो छोटी है या इनपुट के बारे में गलत एन्कोडिंग जानकारी बताई गई है।
55357 और 56842 क्रमशः 0xD83D और 0xDE0A हेक्स में हैं।
यूनिकोड में वे क्रमशः "हाई सरोगेट" और "लो सरोगेट" नामक श्रेणियों में हैं।
इसका मतलब है कि वे नहीं . हैं उचित यूनिकोड कोडपॉइंट, बल्कि यूटीएफ -16 में एक एकल यूनिकोड मान बनाने के लिए उपयोग किया जाता है जो 16 बिट (यानी मूल बहुभाषी विमान) में फिट नहीं होता है।
ये दो विशिष्ट मान U+1F60A मुस्कुराते हुए आंखों के साथ मुस्कुराते हुए चेहरे को डिकोड करते हैंए> . उसके लिए सही दशमलव HTML इकाई 😊
. होगी ।
इसका सबसे संभावित कारण यह है कि कुछ परिवर्तन जो या तो UTF-16 के बारे में नहीं जानते या विचार यह पाठ यूटीएफ -16 नहीं है एन्कोडिंग किया था (लेकिन यह पता लगाना चाहिए था कि वे मान अमान्य हैं और उस मामले में भी एक त्रुटि की सूचना दी है)।