यह सब utf-8 एन्कोडिंग के बारे में है। Erlang में वर्णों की एक सूची, आपके मामले में [240,159,152,130]
, सामान्य रूप से एन्कोडेड नहीं होते हैं लेकिन यूनिकोड कोड पॉइंट होते हैं। जब आपने डेटा पुनर्प्राप्त किया तो आपको अपने पात्रों के utf-8 एन्कोडिंग बाइट्स वाली बाइनरी मिली। वास्तव में यह एन्कोडिंग कहां हुई, मुझे नहीं पता। एरलांग शेल से:
10> Bin = <<195,176,194,159,194,152,194,130>>.
<<195,176,194,159,194,152,194,130>>
11> <<M/utf8,N/utf8,O/utf8,P/utf8,R/binary>> = Bin.
<<195,176,194,159,194,152,194,130>>
12> [M,N,O,P].
[240,159,152,130]
एरलांग में यूनिकोड को संभालना बहुत सरल है, सूचियों में वर्ण आमतौर पर यूनिकोड कोड बिंदु होते हैं और बहुत ही कम एन्कोडेड होते हैं, जबकि उन्हें बायनेरिज़ में संग्रहीत करने का मतलब है कि आपको उन्हें किसी तरह से एन्कोड करना होगा, क्योंकि बायनेरिज़ केवल बाइट्स की सरणियाँ हैं। डिफ़ॉल्ट एन्कोडिंग utf-8 है। मॉड्यूल में unicode
यूनिकोड सूचियों और बायनेरिज़ के बीच कनवर्ट करने के लिए फ़ंक्शन हैं।