प्रश्न के उत्तर के अनुसार एक्सेल टू CSV UTF8 एन्कोडिंग के साथ , Google डॉक्स को एक्सेल के विपरीत सीएसवी को ठीक से सहेजना चाहिए, जो उन सभी वर्णों को नष्ट कर देता है जो उपयोग किए जा रहे "एएनएसआई" एन्कोडिंग में प्रतिनिधित्व योग्य नहीं हैं। लेकिन शायद उन्होंने इसे बदल दिया, या कुछ गलत, या स्थिति का विश्लेषण गलत है।
एमएस ऑफिस कार्यक्रमों में संसाधित बांग्ला (बंगाली) को ठीक से एन्कोड करने के लिए, किसी भी "बांग्ला फोंट" की आवश्यकता नहीं होनी चाहिए, क्योंकि एरियल यूनिकोड एमएस फ़ॉन्ट (ऑफिस के साथ शिप किया गया) में बांग्ला वर्ण होते हैं। तो क्या डेटा वास्तव में कुछ गैर-मानक एन्कोडिंग में है जो विशेष रूप से एन्कोडेड फ़ॉन्ट पर निर्भर करता है? उस स्थिति में, इसे पहले यूनिकोड में परिवर्तित किया जाना चाहिए, हालांकि संभवतः इसे किसी भी तरह से प्रोग्राम का उपयोग करके प्रबंधित किया जा सकता है जो लगातार उस विशिष्ट फ़ॉन्ट का उपयोग करते हैं।
एक्सेल में, इस रूप में सहेजें का उपयोग करते समय, आप "यूनिकोड टेक्स्ट (*.txt)" का चयन कर सकते हैं। यह डेटा को UTF-16 एन्कोडिंग में TSV (टैब से अलग किए गए मान) के रूप में सहेजता है। फिर आपको इसे टैब के बजाय अल्पविराम के रूप में उपयोग करने के लिए और/या UTF-16 से UTF-8 में परिवर्तित करने की आवश्यकता हो सकती है। लेकिन यह तभी काम करता है जब मूल डेटा ठीक से एन्कोड किया गया हो।