अपनी पिछली पोस्ट में, मैंने 1 से 1,000 तक सन्निहित संख्याओं के अनुक्रम को उत्पन्न करने के तरीकों के बारे में बात की थी। अब मैं पैमाने के अगले स्तरों के बारे में बात करना चाहता हूं:50,000 और 1,00,000 संख्याओं के सेट बनाना।
50,000 संख्याओं का एक सेट बनाना
इस श्रृंखला को शुरू करते समय, मैं वास्तव में उत्सुक था कि विभिन्न दृष्टिकोण संख्याओं के बड़े सेट तक कैसे पहुंचेंगे। कम अंत में मैं यह जानकर थोड़ा निराश हुआ कि मेरा पसंदीदा तरीका - sys.all_objects
का उपयोग कर रहा है - सबसे कारगर तरीका नहीं था। लेकिन इन विभिन्न तकनीकों का पैमाना 50,000 पंक्तियों तक कैसे होगा?
नंबर तालिका
चूंकि हमने पहले ही 1,000,000 पंक्तियों के साथ एक नंबर तालिका बना ली है, यह क्वेरी लगभग समान रहती है:
SELECT TOP (50000) n FROM dbo.Numbers ORDER BY n;
योजना:
spt_values
चूँकि spt_values
. में केवल ~2,500 पंक्तियाँ हैं , यदि हम इसे अपने सेट जनरेटर के स्रोत के रूप में उपयोग करना चाहते हैं तो हमें थोड़ा और रचनात्मक होने की आवश्यकता है। एक बड़ी तालिका का अनुकरण करने का एक तरीका है CROSS JOIN
यह खुद के खिलाफ। अगर हमने वह कच्चा किया तो हम ~ 2,500 पंक्तियों के साथ समाप्त हो जाएंगे (6 मिलियन से अधिक)। केवल 50,000 पंक्तियों की आवश्यकता है, हमें लगभग 224 पंक्तियों का वर्ग चाहिए। तो हम यह कर सकते हैं:
;WITH x AS ( SELECT TOP (224) number FROM [master]..spt_values ) SELECT TOP (50000) n = ROW_NUMBER() OVER (ORDER BY x.number) FROM x CROSS JOIN x AS y ORDER BY n;
ध्यान दें कि यह इस भिन्नता के समतुल्य है, लेकिन उससे अधिक संक्षिप्त है:
SELECT TOP (50000) n = ROW_NUMBER() OVER (ORDER BY x.number) FROM (SELECT TOP (224) number FROM [master]..spt_values) AS x CROSS JOIN (SELECT TOP (224) number FROM [master]..spt_values) AS y ORDER BY n;
दोनों ही मामलों में, योजना इस तरह दिखती है:
sys.all_objects
जैसे spt_values
, sys.all_objects
हमारी 50,000 पंक्ति की आवश्यकता को अपने आप पूरी तरह से संतुष्ट नहीं करता है, इसलिए हमें एक समान CROSS JOIN
करने की आवश्यकता होगी ।
;;WITH x AS ( SELECT TOP (224) [object_id] FROM sys.all_objects ) SELECT TOP (50000) n = ROW_NUMBER() OVER (ORDER BY x.[object_id]) FROM x CROSS JOIN x AS y ORDER BY n;
योजना:
स्टैक्ड सीटीई
ठीक 50,000 पंक्तियाँ प्राप्त करने के लिए हमें अपने स्टैक्ड सीटीई में केवल एक मामूली समायोजन करने की आवश्यकता है:
;WITH e1(n) AS ( SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 ), -- 10 e2(n) AS (SELECT 1 FROM e1 CROSS JOIN e1 AS b), -- 10*10 e3(n) AS (SELECT 1 FROM e2 CROSS JOIN e2 AS b), -- 100*100 e4(n) AS (SELECT 1 FROM e3 CROSS JOIN (SELECT TOP 5 n FROM e1) AS b) -- 5*10000 SELECT n = ROW_NUMBER() OVER (ORDER BY n) FROM e4 ORDER BY n;
योजना:
पुनरावर्ती सीटीई
हमारे पुनरावर्ती CTE से 50,000 पंक्तियों को प्राप्त करने के लिए और भी कम महत्वपूर्ण परिवर्तन की आवश्यकता है:WHERE
बदलें खंड को 50,000 में बदलें और MAXRECURSION
बदलें शून्य का विकल्प।
;WITH n(n) AS ( SELECT 1 UNION ALL SELECT n+1 FROM n WHERE n < 50000 ) SELECT n FROM n ORDER BY n OPTION (MAXRECURSION 0);
योजना:
इस मामले में सॉर्ट पर एक चेतावनी आइकन है - जैसा कि यह पता चला है, मेरे सिस्टम पर, टेम्पर्ड को फैलाने के लिए आवश्यक सॉर्ट। हो सकता है कि आप अपने सिस्टम पर कोई रिसाव न देखें, लेकिन यह इस तकनीक के लिए आवश्यक संसाधनों के बारे में एक चेतावनी होनी चाहिए।
प्रदर्शन
परीक्षणों के अंतिम सेट की तरह, हम प्रत्येक तकनीक की तुलना करेंगे, जिसमें ठंडे और गर्म कैश, और संपीड़ित और असम्पीडित दोनों के साथ Numbers तालिका शामिल है:
रनटाइम, मिलीसेकंड में, 50,000 सन्निहित संख्याएं जेनरेट करने के लिए
बेहतर दृश्य प्राप्त करने के लिए, आइए पुनरावर्ती CTE को हटा दें, जो इस परीक्षण में कुल कुत्ता था और जो परिणामों को खराब करता है:
रनटाइम, मिलीसेकंड में, 50,000 सन्निहित संख्याएं उत्पन्न करने के लिए (पुनरावर्ती को छोड़कर) सीटीई)
1,000 पंक्तियों में, संपीड़ित और असम्पीडित के बीच का अंतर मामूली था, क्योंकि क्वेरी को केवल क्रमशः 8 और 9 पृष्ठों को पढ़ने की आवश्यकता थी। 50,000 पंक्तियों में, अंतर थोड़ा चौड़ा हो जाता है:74 पृष्ठ बनाम 113। हालांकि, डेटा को डीकंप्रेस करने की कुल लागत I/O में बचत से अधिक लगती है। तो, 50,000 पंक्तियों में, एक असम्पीडित संख्या तालिका एक सन्निहित सेट प्राप्त करने का सबसे कुशल तरीका प्रतीत होता है - हालांकि, माना जाता है कि लाभ मामूली है।
1,000,000 संख्याओं का समूह बनाना
हालांकि मैं बहुत से उपयोग के मामलों की कल्पना नहीं कर सकता, जहां आपको इतनी बड़ी संख्या के एक सटे हुए सेट की आवश्यकता होगी, मैं इसे पूर्णता के लिए शामिल करना चाहता था, और क्योंकि मैंने इस पैमाने पर कुछ दिलचस्प अवलोकन किए थे।
नंबर तालिका
यहाँ कोई आश्चर्य की बात नहीं है, अब हमारी क्वेरी है:
SELECT TOP 1000000 n FROM dbo.Numbers ORDER BY n;
TOP
कड़ाई से आवश्यक नहीं है, लेकिन ऐसा केवल इसलिए है क्योंकि हम जानते हैं कि हमारी संख्या तालिका और हमारे वांछित आउटपुट में पंक्तियों की संख्या समान है। योजना अभी भी पिछले परीक्षणों के समान ही है:
spt_values
CROSS JOIN
प्राप्त करने के लिए जो 1,000,000 पंक्तियाँ उत्पन्न करता है, हमें 1,000 पंक्तियों को चुकता करने की आवश्यकता है:
;WITH x AS ( SELECT TOP (1000) number FROM [master]..spt_values ) SELECT n = ROW_NUMBER() OVER (ORDER BY x.number) FROM x CROSS JOIN x AS y ORDER BY n;
योजना:
sys.all_objects
फिर से, हमें 1,000 पंक्तियों के क्रॉस उत्पाद की आवश्यकता है:
;WITH x AS ( SELECT TOP (1000) [object_id] FROM sys.all_objects ) SELECT n = ROW_NUMBER() OVER (ORDER BY x.[object_id]) FROM x CROSS JOIN x AS y ORDER BY n;
योजना:
स्टैक्ड सीटीई
स्टैक्ड CTE के लिए, हमें बस CROSS JOIN
. के थोड़े अलग संयोजन की आवश्यकता है s 1,00,000 पंक्तियाँ प्राप्त करने के लिए:
;WITH e1(n) AS ( SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 ), -- 10 e2(n) AS (SELECT 1 FROM e1 CROSS JOIN e1 AS b), -- 10*10 e3(n) AS (SELECT 1 FROM e1 CROSS JOIN e2 AS b), -- 10*100 e4(n) AS (SELECT 1 FROM e3 CROSS JOIN e3 AS b) -- 1000*1000 SELECT n = ROW_NUMBER() OVER (ORDER BY n) FROM e4 ORDER BY n;
योजना:
इस पंक्ति आकार में, आप देख सकते हैं कि स्टैक्ड CTE समाधान समानांतर हो जाता है। इसलिए मैंने MAXDOP 1
. के साथ एक संस्करण भी चलाया पहले की तरह एक समान योजना आकार प्राप्त करने के लिए, और यह देखने के लिए कि क्या समानता वास्तव में मदद करती है:
पुनरावर्ती CTE
पुनरावर्ती सीटीई में फिर से बस एक मामूली बदलाव है; केवल WHERE
क्लॉज को बदलने की जरूरत है:
;WITH n(n) AS ( SELECT 1 UNION ALL SELECT n+1 FROM n WHERE n < 1000000 ) SELECT n FROM n ORDER BY n OPTION (MAXRECURSION 0);
योजना:
प्रदर्शन
एक बार फिर हम देखते हैं कि रिकर्सिव सीटीई का प्रदर्शन बेहद खराब है:
रनटाइम, मिलीसेकंड में, 1,000,000 सन्निहित संख्याएं उत्पन्न करने के लिए
ग्राफ़ से उस बाहरी को हटाकर, हमें प्रदर्शन के बारे में एक बेहतर तस्वीर मिलती है:
रनटाइम, मिलीसेकंड में, 1,000,000 सन्निहित संख्याएं उत्पन्न करने के लिए (पुनरावर्ती को छोड़कर) सीटीई)
जबकि फिर से हम असम्पीडित संख्या तालिका (कम से कम एक गर्म कैश के साथ) को विजेता के रूप में देखते हैं, इस पैमाने पर भी अंतर इतना उल्लेखनीय नहीं है।
जारी रखने के लिए...
अब जबकि हमने संख्याओं का एक क्रम उत्पन्न करने के लिए मुट्ठी भर दृष्टिकोणों का अच्छी तरह से पता लगा लिया है, हम तारीखों पर आगे बढ़ेंगे। इस श्रृंखला की अंतिम पोस्ट में, हम एक सेट के रूप में एक तिथि सीमा के निर्माण के माध्यम से चलेंगे, जिसमें एक कैलेंडर तालिका का उपयोग और कुछ उपयोग के मामले शामिल हैं जहां यह आसान हो सकता है।
[ भाग 1 | भाग 2 | भाग 3 ]
परिशिष्ट :पंक्तियों की संख्या
हो सकता है कि आप पंक्तियों की सटीक संख्या उत्पन्न करने का प्रयास नहीं कर रहे हों; इसके बजाय आप बहुत सी पंक्तियों को उत्पन्न करने का एक सीधा तरीका चाहते हैं। निम्नलिखित कैटलॉग दृश्यों के संयोजनों की एक सूची है जो आपको विभिन्न पंक्ति गणनाएं प्रदान करेगा यदि आप केवल SELECT
करते हैं बिना WHERE
खंड। ध्यान दें कि ये नंबर इस बात पर निर्भर करेंगे कि आप आरटीएम में हैं या सर्विस पैक पर (चूंकि कुछ सिस्टम ऑब्जेक्ट जुड़ते या संशोधित होते हैं), और यह भी कि आपके पास एक खाली डेटाबेस है या नहीं।
स्रोत | <वें colspan=3>पंक्ति गणना|||
---|---|---|---|
SQL Server 2008 R2 | एसक्यूएल सर्वर 2012 | एसक्यूएल सर्वर 2014 | |
मास्टर..spt_values | 2,508 | 2,515 | 2,519 |
मास्टर..spt_values क्रॉस जॉइन मास्टर..spt_values | 6,290,064 | 6,325,225 | 6,345,361 |
sys.all_objects | 1,990 | 2,089 | 2,165 |
sys.all_columns | 5,157 | 7,276 | 8,560 |
sys.all_objects क्रॉस जॉइन sys.all_objects | 3,960,100 | 4,363,921 | 4,687,225 |
sys.all_objects क्रॉस जॉइन sys.all_columns | 10,262,430 | 15,199,564 | 18,532,400 |
sys.all_columns क्रॉस जॉइन sys.all_columns | 26,594,649 | 52,940,176 | 73,273,600 |
तालिका 1:विभिन्न कैटलॉग दृश्य प्रश्नों के लिए पंक्ति गणना