संदर्भ के लिए, Power BI Microsoft द्वारा विकसित एक डेटा विज़ुअलाइज़ेशन और एनालिटिक्स सॉफ़्टवेयर है। Power BI का उपयोग स्थिर और साथ ही इंटरैक्टिव डेटा विज़ुअलाइज़ेशन के लिए किया जा सकता है। इससे पहले कि आप Power BI के साथ वास्तविक विज़ुअलाइज़ेशन बना सकें, आप Power BI क्वेरी संपादक का उपयोग करके डेटा प्रीप्रोसेसिंग कर सकते हैं।
क्वेरी संपादक के साथ, आप विभिन्न डेटा परिवर्तन कार्य कर सकते हैं, जैसे कॉलम प्रकार बदलना, गुम मानों को संभालना, पंक्तियों और स्तंभों को हटाना, स्तंभों को पिवट करना और अनपिवो करना, स्तंभों को विभाजित करना आदि।
इस लेख में, आप देखेंगे कि Power BI Query संपादक का उपयोग करके स्तंभों को पिवट, अनपिवट और विभाजित कैसे करें।
क्वेरी संपादक में डेटा सेट आयात करना
इस आलेख में उदाहरण के रूप में उपयोग किया गया डेटासेट एक CSV फ़ाइल स्वरूप में है जिसे इस kaggle लिंक का उपयोग करके डाउनलोड किया जा सकता है। CSV फ़ाइल को अपने स्थानीय फ़ाइल सिस्टम में डाउनलोड करें।
इसके बाद, पावर बीआई डेस्कटॉप खोलें, शीर्ष मेनू से "डेटा प्राप्त करें" बटन पर क्लिक करें। ड्रॉपडाउन सूची से, नीचे दिखाए अनुसार “टेक्स्ट/सीएसवी” चुनें।

Power BI को डेटा आयात करने में कुछ समय लगेगा। एक बार डेटा लोड हो जाने पर, आपको नीचे दी गई विंडो देखनी चाहिए।
डेटासेट में दुनिया के सभी देशों की जनसंख्या, क्षेत्रफल, जन्म दर, मृत्यु दर, जनसंख्या घनत्व, प्रति व्यक्ति जीडीपी, फोन प्रति 1000 आदि के बारे में जानकारी होती है। क्वेरी संपादक में डेटा लोड करने के लिए, "डेटा ट्रांसफ़ॉर्म करें" बटन पर क्लिक करें।

क्वेरी संपादक इस तरह दिखता है:

क्वेरी संपादक में, आप विभिन्न प्रीप्रोसेसिंग कर सकते हैं जैसे पिवोटिंग, अनपिवोटिंग और स्प्लिटिंग कॉलम।
पिवोटिंग और अनपिवोटिंग थ्योरी
इससे पहले कि हम वास्तव में Power BI क्वेरी संपादक के साथ पिवोटिंग और अनपिवोटिंग कॉलम पर जाएं। आइए अनपिवटिंग के एक बहुत ही बुनियादी उदाहरण पर विचार करें।
अनपिवोटिंग
मान लें कि आपके पास एक डेटासेट है जिसमें निम्न जानकारी है। निम्न तालिका में पंक्तियाँ देशों के अनुरूप हैं, जबकि कॉलम प्रति व्यक्ति सकल घरेलू उत्पाद और संबंधित देशों के लिए साक्षरता दर के बारे में पंक्तियों में जानकारी दिखाते हैं। (नोट:ये सिर्फ नकली मान हैं, वास्तविक मान नहीं)
देश | प्रति व्यक्ति जीडीपी | साक्षरता दर |
फ़्रांस | 30,000 | 95% |
जर्मनी | 25,000 | 96% |
अगर आप एक कॉलम को अनपिवट करते हैं, उदाहरण के लिए जीडीपी प्रति व्यक्ति, तो बिना पिवट वाले कॉलम वाला डेटासेट इस तरह दिखेगा।
देश | विशेषता | मान | साक्षरता |
फ़्रांस | प्रति व्यक्ति जीडीपी | 30,000 | 95% |
जर्मनी | प्रति व्यक्ति जीडीपी | 25,000 | 96% |
आप देख सकते हैं कि प्रति व्यक्ति जीडीपी कॉलम को दो कॉलम, यानी एट्रीब्यूट और वैल्यू से बदल दिया गया है। "एट्रिब्यूट" कॉलम के मान उस कॉलम के नाम से मेल खाते हैं, जो बिना पिवट वाला है, जबकि "वैल्यू" कॉलम में वे मान होते हैं, जो पहले बिना वोट वाले कॉलम में मौजूद थे। चूंकि केवल एक ही स्तंभ अप्रकाशित है, इसलिए "विशेषता" स्तंभ के मान हमेशा समान रहेंगे। साथ ही, डेटासेट में पंक्तियों की संख्या एक बिना धुरी वाले कॉलम के समान रहेगी।
आइए अब यह देखने का प्रयास करें कि जब हम दो स्तंभों को अनपिवट करते हैं तो क्या होता है। हम मूल डेटासेट में जीडीपी प्रति व्यक्ति और साक्षरता दर कॉलम दोनों को अनपिवट कर देंगे। दो अप्रकाशित स्तंभों वाला डेटासेट इस तरह दिखता है।
देश | विशेषता | मान |
फ़्रांस | प्रति व्यक्ति जीडीपी | 30,000 |
फ़्रांस | साक्षरता दर | 95% |
जर्मनी | प्रति व्यक्ति जीडीपी | 25,000 |
जर्मनी | साक्षरता दर | 96% |
उपरोक्त डेटासेट में, आप देख सकते हैं कि प्रत्येक देश के नाम के लिए, "विशेषता" कॉलम में अब दो अद्वितीय मान हैं:प्रति व्यक्ति जीडीपी और साक्षरता दर। "मान" कॉलम में विशेषताओं के लिए संबंधित मान होते हैं। ध्यान दें कि पंक्तियों की संख्या दोगुनी हो गई है। इसी तरह, यदि आप तीन स्तंभों को अनपिवट करते हैं, तो डेटासेट में पंक्तियों की संख्या तीन गुना बढ़ जाती है।
पिवट करना
पिवोटिंग, जैसा कि नाम से पता चलता है, उस प्रक्रिया को संदर्भित करता है जिसका उपयोग एक अप्रकाशित डेटासेट को उसके मूल रूप में उलटने के लिए किया जाता है। उदाहरण के लिए, पिवोटिंग में इनपुट टेबल इस तरह दिखती है:
देश | विशेषता | मान |
फ़्रांस | प्रति व्यक्ति जीडीपी | 30,000 |
फ़्रांस | साक्षरता दर | 95% |
जर्मनी | प्रति व्यक्ति जीडीपी | 25,000 |
जर्मनी | साक्षरता दर | 96% |
"विशेषता" और "मान" कॉलम पर पिवोटिंग लागू करने के बाद, डेटासेट निम्नलिखित रूप लेता है:
देश | प्रति व्यक्ति जीडीपी | साक्षरता दर |
फ़्रांस | 30,000 | 95% |
जर्मनी | 25,000 | 96% |
अब जब हम जानते हैं कि पिवट और अनपिवटिंग क्या हैं, तो आइए देखें कि Power BI के साथ उन्हें कैसे लागू किया जाए।
पावर बीआई के साथ पिवोटिंग और अनपिवोटिंग
आइए पहले एक उदाहरण देखें कि Power BI क्वेरी संपादक के साथ एकल कॉलम को कैसे अनपिवट किया जाए। यदि आप डेटासेट को देखते हैं, तो इसमें "जनसंख्या" नामक एक कॉलम होता है। "जनसंख्या" कॉलम को अनपिवट करने के लिए, कॉलम हेडर पर क्लिक करें और फिर शीर्ष मेनू से "ट्रांसफ़ॉर्म" विकल्प चुनें। आपको शीर्ष पर कई विकल्पों के साथ एक नया मेनू दिखाई देगा, मेनू से "अनपिवट कॉलम" विकल्प पर क्लिक करें और फिर ड्रॉपडाउन सूची से "अनपिवोट कॉलम" पर क्लिक करें, जैसा कि नीचे दिखाया गया है:

"जनसंख्या" कॉलम को "विशेषता" और "मान" कॉलम से बदल दिया जाएगा, जैसा कि नीचे दिखाया गया है:

अब, एक कॉलम को पिवट करने के लिए, आपके पास दो विकल्प हैं। आप "एप्लाइड स्टेप्स" विंडो से "x Unpivoted Columns" विकल्प पर क्लिक कर सकते हैं, जैसा कि निम्नलिखित स्क्रीनशॉट में दिखाया गया है।

दूसरा विकल्प एक कॉलम का चयन करना है और फिर शीर्ष मेनू से "ट्रांसफ़ॉर्म -> पिवट कॉलम" का चयन करना है, जैसा कि नीचे दिखाया गया है।

एक कॉलम को पिवोट करते समय, आपको उस कॉलम को निर्दिष्ट करना होगा जिसमें अनपिटेड कॉलम के मान शामिल हों। हमारे मामले में, "मान" कॉलम में अप्रकाशित "विशेषता" कॉलम के मान होते हैं। संदर्भ के लिए निम्न स्क्रीनशॉट देखें।

पिवट किया गया "जनसंख्या" कॉलम इस तरह दिखता है:

"पॉपुलेशन" कॉलम को "पॉप" के ठीक बगल में ले जाएँ। घनत्व (प्रति वर्ग मील)” कॉलम “जनसंख्या” कॉलम हेडर पर क्लिक करके और खींचकर, जैसा कि निम्नलिखित स्क्रीनशॉट में दिखाया गया है।

इसके बाद, हम दो कॉलम, यानी "जनसंख्या" और "पॉप" को हटा देंगे। घनत्व (प्रति वर्ग मील)"। दोनों कॉलम हेडर चुनें और फिर उन्हें अनपिवट करें, जैसा कि नीचे दिखाया गया है:

अनपिवट करने के बाद, आपको डेटासेट में बनाए गए निम्नलिखित दो कॉलम दिखाई देने चाहिए। आप देख सकते हैं कि "विशेषता" कॉलम में अब "जनसंख्या" और "पॉप" के बारे में जानकारी है। घनत्व (प्रति वर्ग मील)”।

दोनों कॉलम हेडर (CTRL + क्लिक) का चयन करें और फिर कॉलम को "देश" कॉलम के ठीक बगल में खींचें, जैसा कि नीचे दिखाया गया है।

अब, आप "देश" के नाम, उनकी कुल जनसंख्या और प्रति वर्ग मील जनसंख्या घनत्व देख सकते हैं। आइए "विशेषता" कॉलम का नाम "जनसंख्या प्रकार" में बदलें क्योंकि "विशेषता" कॉलम दो प्रकार की जनसंख्या दिखाता है:कुल जनसंख्या और प्रति वर्ग मील जनसंख्या घनत्व। अपडेट किए गए कॉलम हेडर नाम वाला डेटासेट इस तरह दिखता है:

स्तंभों को विभाजित करना
कॉलम को विभाजित करने से पहले, हम "जनसंख्या प्रकार" कॉलम में कुछ मानों को बदल देंगे।
"जनसंख्या प्रकार" कॉलम में "जनसंख्या" का मान कुल जनसंख्या को दर्शाता है। हम "जनसंख्या" मान को "पॉप" से बदल देंगे। टोटल" ताकि इसका पैटर्न "पॉप" के समान हो। घनत्व (प्रति वर्ग मील)"। कॉलम में मानों को बदलने के लिए, "ट्रांसफ़ॉर्म -> मान बदलें" पर जाएं, जैसा कि निम्न स्क्रीनशॉट में दिखाया गया है।

मानों को बदलने के बाद, डेटासेट इस तरह दिखता है।

अब, हम “जनसंख्या प्रकार” कॉलम को दो भागों में विभाजित करेंगे। इसके पहले पांच अक्षर पहले कॉलम में जोड़े जाएंगे, जबकि शेष अक्षर दूसरे कॉलम में जोड़े जाएंगे। एक कॉलम को विभाजित करने के लिए, "ट्रांसफॉर्म -> स्प्लिट कॉलम" पर जाएं। हम पहले पांच वर्णों से विभाजित होंगे, इसलिए, ड्रॉपडाउन से "वर्णों की संख्या से विभाजित करें" विकल्प चुनें। हम कॉलम को पहले 5 सबसे बाएं वर्णों से विभाजित करेंगे। संदर्भ के लिए, निम्न स्क्रीनशॉट देखें।

एक बार कॉलम विभाजित हो जाने पर, आपको निम्नलिखित दो कॉलम दिखाई देने चाहिए।

हमें केवल "जनसंख्या प्रकार 2" कॉलम की आवश्यकता है क्योंकि इसमें जनसंख्या के प्रकार या पैमाने के बारे में जानकारी होती है। "जनसंख्या प्रकार.1" कॉलम पर क्लिक करें और फिर "हटाएं" चुनें।

अंत में, आप "जनसंख्या प्रकार। 2" कॉलम का नाम बदलकर "जनसंख्या प्रकार" कर सकते हैं जैसा कि नीचे दिखाया गया है।
निम्नलिखित आकृति से, आप देख सकते हैं कि प्रत्येक देश के लिए दो अलग-अलग प्रकार के जनसंख्या मूल्य हैं। "जनसंख्या प्रकार" कॉलम में "कुल" मान देश की कुल जनसंख्या को दर्शाता है। कुल जनसंख्या का वास्तविक मूल्य "जनसंख्या मूल्य" कॉलम में संग्रहीत किया जाता है। इसी तरह, मान "घनत्व (प्रति वर्ग मील)" दर्शाता है कि यह जनसंख्या मान जनसंख्या घनत्व को दर्शाता है।

निष्कर्ष
संक्षेप में, लेख आपको दिखाता है कि Power BI क्वेरी संपादक में पिवोटिंग और अनपिवोटिंग कैसे करें। इसके अतिरिक्त, यह स्पष्ट उदाहरणों द्वारा सचित्र स्तंभों को पिवोटिंग और अनपिवोटिंग के पीछे के मूल सिद्धांत को शामिल करता है। अंत में, लेख बताता है कि Power BI क्वेरी संपादक में स्तंभों को विभाजित करने की प्रक्रिया कैसे कार्यान्वित की जाती है।