टेबल एक्सप्रेशन के मूल तत्व, भाग 6

यह आलेख तालिका भावों के बारे में श्रृंखला का छठा भाग है। पिछले महीने भाग 5 में मैंने गैर-पुनरावर्ती सीटीई के तार्किक उपचार को कवर किया। इस महीने मैं पुनरावर्ती सीटीई के तार्किक उपचार को कवर करता हूं। मैं पुनरावर्ती सीटीई के लिए टी-एसक्यूएल के समर्थन के साथ-साथ मानक तत्वों का वर्णन करता हूं जो अभी तक टी-एसक्यूएल द्वारा समर्थित नहीं हैं। मैं असमर्थित तत्वों के लिए तार्किक रूप से समकक्ष टी-एसक्यूएल वर्कअराउंड प्रदान करता हूं।

नमूना डेटा

नमूना डेटा के लिए मैं कर्मचारी नामक एक तालिका का उपयोग करूंगा, जिसमें कर्मचारियों का एक पदानुक्रम होता है। एम्पीड कॉलम अधीनस्थ (चाइल्ड नोड) की कर्मचारी आईडी का प्रतिनिधित्व करता है, और एमजीग्रिड कॉलम प्रबंधक (पैरेंट नोड) की कर्मचारी आईडी का प्रतिनिधित्व करता है। tempdb डेटाबेस में कर्मचारी तालिका बनाने और पॉप्युलेट करने के लिए निम्न कोड का उपयोग करें:

SET NOCOUNT ON;
 
USE tempdb;
DROP TABLE IF EXISTS dbo.Employees;
GO
 
CREATE TABLE dbo.Employees
(
  empid   INT         NOT NULL
    CONSTRAINT PK_Employees PRIMARY KEY,
  mgrid   INT         NULL     
    CONSTRAINT FK_Employees_Employees REFERENCES dbo.Employees,
  empname VARCHAR(25) NOT NULL,
  salary  MONEY       NOT NULL,
  CHECK (empid <> mgrid)
);
 
INSERT INTO dbo.Employees(empid, mgrid, empname, salary)
  VALUES(1,  NULL, 'David'  , $10000.00),
        (2,     1, 'Eitan'  ,  $7000.00),
        (3,     1, 'Ina'    ,  $7500.00),
        (4,     2, 'Seraph' ,  $5000.00),
        (5,     2, 'Jiru'   ,  $5500.00),
        (6,     2, 'Steve'  ,  $4500.00),
        (7,     3, 'Aaron'  ,  $5000.00),
        (8,     5, 'Lilach' ,  $3500.00),
        (9,     7, 'Rita'   ,  $3000.00),
        (10,    5, 'Sean'   ,  $3000.00),
        (11,    7, 'Gabriel',  $3000.00),
        (12,    9, 'Emilia' ,  $2000.00),
        (13,    9, 'Michael',  $2000.00),
        (14,    9, 'Didi'   ,  $1500.00);
 
CREATE UNIQUE INDEX idx_unc_mgrid_empid
  ON dbo.Employees(mgrid, empid)
  INCLUDE(empname, salary);

ध्यान दें कि कर्मचारी पदानुक्रम की जड़- सीईओ- के पास एमजीग्रिड कॉलम में एक न्यूल है। बाकी सभी कर्मचारियों के पास एक प्रबंधक होता है, इसलिए उनका एमजीग्रिड कॉलम उनके प्रबंधक की कर्मचारी आईडी पर सेट होता है।

चित्र 1 में कर्मचारी पदानुक्रम का चित्रमय चित्रण है, जिसमें कर्मचारी का नाम, आईडी और पदानुक्रम में उसका स्थान दिखाया गया है।

चित्र 1:कर्मचारी पदानुक्रम

पुनरावर्ती CTE

रिकर्सिव सीटीई के कई उपयोग के मामले हैं। उपयोगों की एक क्लासिक श्रेणी का संबंध हमारे कर्मचारी पदानुक्रम की तरह, ग्राफ़ संरचनाओं को संभालने से है। ग्राफ़ से जुड़े कार्यों में अक्सर मनमाने लंबाई वाले पथों को पार करने की आवश्यकता होती है। उदाहरण के लिए, किसी प्रबंधक की कर्मचारी आईडी को देखते हुए, इनपुट कर्मचारी, साथ ही इनपुट कर्मचारी के सभी अधीनस्थों को सभी स्तरों पर लौटाएं; यानी प्रत्यक्ष और अप्रत्यक्ष अधीनस्थ। यदि आपके पास स्तरों की संख्या पर एक ज्ञात छोटी सीमा थी जिसका आपको अनुसरण करने की आवश्यकता हो सकती है (ग्राफ की डिग्री), तो आप अधीनस्थों के प्रति स्तर में शामिल होने के साथ एक क्वेरी का उपयोग कर सकते हैं। हालाँकि, यदि ग्राफ़ की डिग्री संभावित रूप से अधिक है, तो किसी बिंदु पर कई जॉइन के साथ एक क्वेरी लिखना अव्यावहारिक हो जाता है। एक अन्य विकल्प अनिवार्य पुनरावृत्त कोड का उपयोग करना है, लेकिन ऐसे समाधान लंबे होते हैं। यह वह जगह है जहां पुनरावर्ती सीटीई वास्तव में चमकते हैं—वे आपको घोषणात्मक, संक्षिप्त और सहज समाधान का उपयोग करने में सक्षम बनाते हैं।

इससे पहले कि मैं खोज और साइकिल चलाने की क्षमताओं को कवर करूं, मैं अधिक दिलचस्प सामग्री पर पहुंचने से पहले पुनरावर्ती सीटीई की मूल बातें शुरू करूंगा।

याद रखें कि CTE के विरुद्ध क्वेरी का सिंटैक्स इस प्रकार है:

के साथ [ ( <स्तंभ सूची के साथ> ) ]
AS
(
<तालिका अभिव्यक्ति>
)
<बाहरी क्वेरी>;

यहां मैं WITH क्लॉज का उपयोग करके परिभाषित एक CTE दिखाता हूं, लेकिन जैसा कि आप जानते हैं, आप कॉमा द्वारा अलग किए गए कई CTE को परिभाषित कर सकते हैं।

नियमित, गैर-पुनरावर्ती, सीटीई में, आंतरिक तालिका अभिव्यक्ति एक क्वेरी पर आधारित होती है जिसका मूल्यांकन केवल एक बार किया जाता है। पुनरावर्ती सीटीई में, आंतरिक तालिका अभिव्यक्ति आमतौर पर दो प्रश्नों पर आधारित होती है जिन्हें सदस्यों . के रूप में जाना जाता है , हालांकि कुछ विशेष जरूरतों को पूरा करने के लिए आपके पास दो से अधिक हो सकते हैं। सदस्यों को आम तौर पर यूनियन ऑल ऑपरेटर द्वारा अलग किया जाता है ताकि यह इंगित किया जा सके कि उनके परिणाम एकीकृत हैं।

एक सदस्य एंकर सदस्य . हो सकता है -जिसका अर्थ है कि इसका मूल्यांकन केवल एक बार किया जाता है; या यह एक पुनरावर्ती सदस्य . हो सकता है -इसका मतलब है कि इसका बार-बार मूल्यांकन किया जाता है, जब तक कि यह एक खाली परिणाम सेट नहीं लौटाता। एक एंकर सदस्य और एक पुनरावर्ती सदस्य पर आधारित पुनरावर्ती CTE के विरुद्ध क्वेरी का सिंटैक्स यहां दिया गया है:

के साथ [ ( <स्तंभ सूची के साथ> ) ]
AS
(
<एंकर सदस्य>
UNION ALL
<पुनरावर्ती सदस्य>
)
<बाहरी क्वेरी>;

एक सदस्य को पुनरावर्ती बनाता है जो सीटीई नाम का संदर्भ रखता है। यह संदर्भ अंतिम निष्पादन के परिणाम सेट का प्रतिनिधित्व करता है। पुनरावर्ती सदस्य के पहले निष्पादन में, CTE नाम का संदर्भ एंकर सदस्य के परिणाम सेट का प्रतिनिधित्व करता है। एनटी निष्पादन में, जहां एन> 1, सीटीई नाम का संदर्भ पुनरावर्ती सदस्य के (एन -1) निष्पादन के परिणाम सेट का प्रतिनिधित्व करता है। जैसा कि उल्लेख किया गया है, एक बार पुनरावर्ती सदस्य एक खाली सेट देता है, इसे फिर से निष्पादित नहीं किया जाता है। बाहरी क्वेरी में सीटीई नाम का संदर्भ एंकर सदस्य के एकल निष्पादन के एकीकृत परिणाम सेट और पुनरावर्ती सदस्य के सभी निष्पादन का प्रतिनिधित्व करता है।

निम्नलिखित कोड इस उदाहरण में मूल कर्मचारी के रूप में कर्मचारी आईडी 3 पास करते हुए, दिए गए इनपुट प्रबंधक के लिए कर्मचारियों के उपप्रकार को वापस करने के उपरोक्त कार्य को लागू करता है:

DECLARE @root AS INT = 3;
 
WITH C AS
(
  SELECT empid, mgrid, empname
  FROM dbo.Employees
  WHERE empid = @root
 
  UNION ALL
 
  SELECT S.empid, S.mgrid, S.empname
  FROM C AS M
    INNER JOIN dbo.Employees AS S
      ON S.mgrid = M.empid
)
SELECT empid, mgrid, empname
FROM C;

एंकर क्वेरी को केवल एक बार निष्पादित किया जाता है, इनपुट रूट कर्मचारी (हमारे मामले में कर्मचारी 3) के लिए पंक्ति लौटाता है।

पुनरावर्ती क्वेरी पिछले स्तर से कर्मचारियों के समूह में शामिल हो जाती है - सीटीई नाम के संदर्भ द्वारा प्रतिनिधित्व, प्रबंधकों के लिए एम के रूप में उपनाम - कर्मचारी तालिका से उनके प्रत्यक्ष अधीनस्थों के साथ, अधीनस्थों के लिए एस के रूप में उपनाम। जॉइन विधेय S.mgrid =M.empid है, जिसका अर्थ है कि अधीनस्थ का mgrid मान प्रबंधक के empid मान के बराबर है। पुनरावर्ती क्वेरी निम्नानुसार चार बार निष्पादित होती है:

कर्मचारी 3 के अधीनस्थों को वापस करें; आउटपुट:कर्मचारी 7
कर्मचारी 7 के अधीनस्थ लौटें; आउटपुट:कर्मचारी 9 और 11
कर्मचारियों 9 और 11 के अधीनस्थों की वापसी; आउटपुट:12, 13 और 14
कर्मचारियों की वापसी अधीनस्थ 12, 13 और 14; आउटपुट:खाली सेट; रिकर्सन रुक जाता है

बाहरी क्वेरी में सीटीई नाम का संदर्भ एंकर क्वेरी (कर्मचारी 3) के एकल निष्पादन के एकीकृत परिणामों का प्रतिनिधित्व करता है, जिसमें पुनरावर्ती क्वेरी (कर्मचारी 7, 9, 11, 12, 13 और कर्मचारी) के सभी निष्पादन के परिणाम होते हैं। 14)। यह कोड निम्न आउटपुट उत्पन्न करता है:

empid  mgrid  empname
------ ------ --------
3      1      Ina
7      3      Aaron
9      7      Rita
11     7      Gabriel
12     9      Emilia
13     9      Michael
14     9      Didi

प्रोग्रामिंग समाधानों में एक आम समस्या है भगोड़ा कोड जैसे अनंत लूप आमतौर पर एक बग के कारण होता है। रिकर्सिव सीटीई के साथ, एक बग रिकर्सिव सदस्य के रनवे निष्पादन को जन्म दे सकता है। उदाहरण के लिए, मान लीजिए कि एक इनपुट कर्मचारी के अधीनस्थों को वापस करने के हमारे समाधान में, आपके पास पुनरावर्ती सदस्य के शामिल होने के विधेय में एक बग था। ON S.mgrid =M.empid का उपयोग करने के बजाय, आपने ON S.mgrid =S.mgrid का उपयोग किया, जैसे:

DECLARE @root AS INT = 3;
 
WITH C AS
(
  SELECT empid, mgrid, empname
  FROM dbo.Employees
  WHERE empid = @root
 
  UNION ALL
 
  SELECT S.empid, S.mgrid, S.empname
  FROM C AS M
    INNER JOIN dbo.Employees AS S
      ON S.mgrid = S.mgrid
)
SELECT empid, mgrid, empname
FROM C;

तालिका में मौजूद गैर-अशक्त प्रबंधक आईडी वाले कम से कम एक कर्मचारी को देखते हुए, पुनरावर्ती सदस्य का निष्पादन एक गैर-रिक्त परिणाम लौटाता रहेगा। याद रखें कि पुनरावर्ती सदस्य के लिए निहित समाप्ति की स्थिति तब होती है जब उसका निष्पादन एक खाली परिणाम सेट देता है। यदि यह एक गैर-रिक्त परिणाम सेट देता है, तो SQL सर्वर इसे फिर से निष्पादित करता है। आप महसूस करते हैं कि यदि SQL सर्वर में पुनरावर्ती निष्पादन को सीमित करने के लिए कोई तंत्र नहीं है, तो यह केवल पुनरावर्ती सदस्य को बार-बार निष्पादित करता रहेगा। एक सुरक्षा उपाय के रूप में, T-SQL एक MAXRECURSION क्वेरी विकल्प का समर्थन करता है जो पुनरावर्ती सदस्य के निष्पादन की अधिकतम अनुमत संख्या को सीमित करता है। डिफ़ॉल्ट रूप से, यह सीमा 100 पर सेट है, लेकिन आप इसे किसी भी गैर-ऋणात्मक SMALLINT मान में बदल सकते हैं, जिसमें 0 कोई सीमा नहीं दर्शाता है। अधिकतम पुनरावर्तन सीमा को सकारात्मक मान N पर सेट करने का अर्थ है कि पुनरावर्ती सदस्य के N + 1 के निष्पादन का प्रयास एक त्रुटि के साथ निरस्त कर दिया गया है। उदाहरण के लिए, उपरोक्त बग्गी कोड को इस रूप में चलाने का अर्थ है कि आप 100 की डिफ़ॉल्ट अधिकतम रिकर्सन सीमा पर भरोसा करते हैं, इसलिए पुनरावर्ती सदस्य का 101 निष्पादन विफल हो जाता है:

empid  mgrid  empname
------ ------ --------
3      1      Ina
2      1      Eitan
3      1      Ina
...

संदेश 530, स्तर 16, राज्य 1, पंक्ति 121
विवरण समाप्त किया गया। स्टेटमेंट पूरा होने से पहले अधिकतम 100 रिकर्सन समाप्त हो गया है।

मान लें कि आपके संगठन में यह मान लेना सुरक्षित है कि कर्मचारी पदानुक्रम 6 प्रबंधन स्तरों से अधिक नहीं होगा। आप अधिकतम पुनरावर्तन सीमा को 100 से बहुत छोटी संख्या तक कम कर सकते हैं, जैसे 10 सुरक्षित पक्ष पर रहने के लिए, जैसे:

DECLARE @root AS INT = 3;
 
WITH C AS
(
  SELECT empid, mgrid, empname
  FROM dbo.Employees
  WHERE empid = @root
 
  UNION ALL
 
  SELECT S.empid, S.mgrid, S.empname
  FROM C AS M
    INNER JOIN dbo.Employees AS S
      ON S.mgrid = S.mgrid
)
SELECT empid, mgrid, empname
FROM C
OPTION (MAXRECURSION 10);

अब यदि कोई बग है जिसके परिणामस्वरूप पुनरावर्ती सदस्य का भगोड़ा निष्पादन होता है, तो यह 101 निष्पादन के बजाय पुनरावर्ती सदस्य के 11 प्रयास किए गए निष्पादन में खोजा जाएगा:

empid  mgrid  empname
------ ------ --------
3      1      Ina
2      1      Eitan
3      1      Ina
...

संदेश 530, स्तर 16, राज्य 1, पंक्ति 149
विवरण समाप्त किया गया। स्टेटमेंट पूरा होने से पहले अधिकतम रिकर्सन 10 समाप्त हो गया है।

यह ध्यान रखना महत्वपूर्ण है कि अधिकतम रिकर्सन सीमा का उपयोग मुख्य रूप से बग्गी रनवे कोड के निष्पादन को रोकने के लिए सुरक्षा उपाय के रूप में किया जाना चाहिए। याद रखें कि जब सीमा पार हो जाती है, तो कोड का निष्पादन त्रुटि के साथ निरस्त कर दिया जाता है। फ़िल्टरिंग उद्देश्यों के लिए विज़िट किए जाने वाले स्तरों की संख्या को सीमित करने के लिए आपको इस विकल्प का उपयोग नहीं करना चाहिए। आप नहीं चाहते कि कोड में कोई समस्या न होने पर कोई त्रुटि उत्पन्न हो।

फ़िल्टरिंग उद्देश्यों के लिए, आप प्रोग्राम के अनुसार विज़िट करने के लिए स्तरों की संख्या को सीमित कर सकते हैं। आप lvl नामक कॉलम को परिभाषित करते हैं जो इनपुट रूट कर्मचारी की तुलना में वर्तमान कर्मचारी के स्तर की संख्या को ट्रैक करता है। एंकर क्वेरी में आप lvl कॉलम को स्थिर 0 पर सेट करते हैं। पुनरावर्ती क्वेरी में आप इसे प्रबंधक के lvl मान प्लस 1 पर सेट करते हैं। इनपुट रूट के नीचे कई स्तरों को @maxlevel के रूप में फ़िल्टर करने के लिए, विधेय M.lvl <@ जोड़ें। पुनरावर्ती क्वेरी के ON क्लॉज के लिए maxlevel। उदाहरण के लिए, निम्न कोड कर्मचारी 3 और कर्मचारी 3 के अधीनस्थों के दो स्तरों को लौटाता है:

DECLARE @root AS INT = 3, @maxlevel AS INT = 2;
 
WITH C AS
(
  SELECT empid, mgrid, empname, 0 AS lvl
  FROM dbo.Employees
  WHERE empid = @root
 
  UNION ALL
 
  SELECT S.empid, S.mgrid, S.empname, M.lvl + 1 AS lvl
  FROM C AS M
    INNER JOIN dbo.Employees AS S
      ON S.mgrid = M.empid
      AND M.lvl < @maxlevel
)
SELECT empid, mgrid, empname, lvl
FROM C;

यह क्वेरी निम्न आउटपुट उत्पन्न करती है:

empid  mgrid  empname  lvl
------ ------ -------- ----
3      1      Ina      0
7      3      Aaron    1
9      7      Rita     2
11     7      Gabriel  2

मानक खोज और चक्र खंड

आईएसओ/आईईसी एसक्यूएल मानक पुनरावर्ती सीटीई के लिए दो बहुत शक्तिशाली विकल्पों को परिभाषित करता है। एक खोज नामक एक खंड है जो पुनरावर्ती खोज क्रम को नियंत्रित करता है, और दूसरा एक खंड है जिसे CYCLE कहा जाता है जो ट्रैवर्स किए गए पथों में चक्रों की पहचान करता है। यहाँ दो खंडों के लिए मानक वाक्य रचना है:

7.18 <खोज या चक्र खंड

फ़ंक्शन

रिकर्सिव क्वेरी एक्सप्रेशन के परिणाम में ऑर्डरिंग और साइकिल डिटेक्शन जानकारी की पीढ़ी निर्दिष्ट करें।

प्रारूप

<सूची तत्व के साथ> ::=
<क्वेरी नाम> [ <बाएं माता-पिता> <स्तंभ सूची के साथ> <दाएं माता-पिता> ]
AS <तालिका उपश्रेणी> [ <खोज या चक्र खंड> ]
<खोज या चक्र खंड> ::=
<खोज खंड> | <चक्र खंड> | <खोज खंड> <चक्र खंड>
खोज खंड> ::=
खोज <पुनरावर्ती खोज आदेश> सेट <अनुक्रम कॉलम>
<पुनरावर्ती खोज आदेश> ::=
<कॉलम नाम सूची> द्वारा सबसे पहले गहराई | चौड़ाई पहले <कॉलम नाम सूची>
अनुक्रम कॉलम> ::=<कॉलम नाम>
<चक्र खंड> ::=
चक्र <चक्र स्तंभ सूची> सेट <चक्र चिह्न स्तंभ> के लिए <चक्र चिह्न मान>
डिफ़ॉल्ट <गैर-चक्र चिह्न मान> <पथ स्तंभ> का उपयोग करना>
<चक्र स्तंभ सूची> ::=<चक्र स्तंभ> [ { <अल्पविराम> <चक्र स्तंभ> }… ]
<चक्र स्तंभ> ::=<स्तंभ नाम>
<चक्र चिह्न स्तंभ> ::=<स्तंभ नाम>
<पथ स्तंभ> ::=<स्तंभ नाम>
<साइकिल मार्क वैल्यू> ::=<वैल्यू एक्सप्रेशन>
<नॉन-साइकिल मार्क वैल्यू> ::=<वैल्यू एक्सप्रेशन>

टी-एसक्यूएल लिखते समय इन विकल्पों का समर्थन नहीं करता है, लेकिन निम्नलिखित लिंक में आप भविष्य में टी-एसक्यूएल में शामिल करने के लिए फीचर सुधार अनुरोध पा सकते हैं, और उनके लिए वोट कर सकते हैं:

टी-एसक्यूएल में पुनरावर्ती सीटीई के लिए आईएसओ/आईईसी एसक्यूएल खोज खंड के लिए समर्थन जोड़ें
T-SQL में पुनरावर्ती CTE के लिए ISO/IEC SQL CYCLE क्लॉज के लिए समर्थन जोड़ें

निम्नलिखित अनुभागों में मैं दो मानक विकल्पों का वर्णन करूँगा और तार्किक रूप से समकक्ष वैकल्पिक समाधान भी प्रदान करूँगा जो वर्तमान में T-SQL में उपलब्ध हैं।

खोज खंड

मानक खोज खंड कुछ निर्दिष्ट ऑर्डरिंग कॉलम द्वारा रिकर्सिव सर्च ऑर्डर को पहले चौड़ाई या गहराई के रूप में परिभाषित करता है, और विज़िट किए गए नोड्स की क्रमिक स्थिति के साथ एक नया अनुक्रम कॉलम बनाता है। आप पहले प्रत्येक स्तर (चौड़ाई) में खोज करने के लिए पहले चौड़ाई निर्दिष्ट करते हैं और फिर स्तरों (गहराई) के नीचे। आप पहले नीचे (गहराई) और फिर पार (चौड़ाई) खोजने के लिए DEPTH FIRST निर्दिष्ट करते हैं।

आप बाहरी क्वेरी के ठीक पहले खोज खंड निर्दिष्ट करते हैं।

मैं चौड़ाई पहले पुनरावर्ती खोज क्रम के लिए एक उदाहरण के साथ शुरू करूंगा। बस याद रखें कि यह सुविधा टी-एसक्यूएल में उपलब्ध नहीं है, इसलिए आप वास्तव में उन उदाहरणों को चलाने में सक्षम नहीं होंगे जो एसक्यूएल सर्वर या एज़ूर एसक्यूएल डेटाबेस में मानक क्लॉज का उपयोग करते हैं। निम्नलिखित कोड कर्मचारी 1 का उपप्रकार लौटाता है, एम्पिड द्वारा चौड़ाई पहले खोज आदेश के लिए पूछता है, एक अनुक्रम स्तंभ बनाता है जिसे seqbreadth कहा जाता है जिसमें विज़िट किए गए नोड्स की क्रमिक स्थिति होती है:

DECLARE @root AS INT = 1;
 
WITH C AS
(
  SELECT empid, mgrid, empname
  FROM dbo.Employees
  WHERE empid = @root
 
  UNION ALL
 
  SELECT S.empid, S.mgrid, S.empname
  FROM C AS M
    INNER JOIN dbo.Employees AS S
      ON S.mgrid = M.empid
)
 
SEARCH BREADTH FIRST BY empid SET seqbreadth
--------------------------------------------
 
SELECT empid, mgrid, empname, seqbreadth
FROM C
ORDER BY seqbreadth;

यहां इस कोड का वांछित आउटपुट दिया गया है:

empid  mgrid  empname  seqbreadth
------ ------ -------- -----------
1      NULL   David    1
2      1      Eitan    2
3      1      Ina      3
4      2      Seraph   4
5      2      Jiru     5
6      2      Steve    6
7      3      Aaron    7
8      5      Lilach   8
9      7      Rita     9
10     5      Sean     10
11     7      Gabriel  11
12     9      Emilia   12
13     9      Michael  13
14     9      Didi     14

इस तथ्य से भ्रमित न हों कि seqbreadth मान empid मानों के समान प्रतीत होते हैं। यह केवल संयोग से है क्योंकि मैंने अपने द्वारा बनाए गए नमूना डेटा में एम्पीड मानों को मैन्युअल रूप से असाइन किया है।

चित्र 2 में कर्मचारी पदानुक्रम का एक चित्रमय चित्रण है, जिसमें एक बिंदीदार रेखा चौड़ाई के पहले क्रम को दिखाती है जिसमें नोड्स की खोज की गई थी। एम्पिड मान कर्मचारी के नाम के ठीक नीचे दिखाई देते हैं, और असाइन किए गए seqbreadth मान प्रत्येक बॉक्स के निचले बाएँ कोने में दिखाई देते हैं।

चित्र 2:पहले चौड़ाई खोजें

यहां ध्यान देने योग्य बात यह है कि प्रत्येक स्तर के भीतर, नोड के मूल संघ के बावजूद, निर्दिष्ट कॉलम ऑर्डर (हमारे मामले में एम्पीड) के आधार पर नोड्स की खोज की जाती है। उदाहरण के लिए, ध्यान दें कि चौथे स्तर में लिलाच पहले, रीटा दूसरे, शॉन तीसरे और गेब्रियल तक पहुंच गया है। ऐसा इसलिए है क्योंकि चौथे स्तर के सभी कर्मचारियों के बीच, उनका क्रम उनके समान मूल्यों पर आधारित है। ऐसा नहीं है कि लिलाच और सीन को लगातार खोजा जाना चाहिए क्योंकि वे एक ही प्रबंधक, जिरू के सीधे अधीनस्थ हैं।

टी-एसक्यूएल समाधान के साथ आना काफी सरल है जो मानक SAERCH DEPTH FIRST विकल्प के तार्किक समकक्ष प्रदान करता है। आप lvl नामक एक कॉलम बनाते हैं, जैसा कि मैंने रूट के संबंध में नोड के स्तर को ट्रैक करने के लिए पहले दिखाया था (पहले स्तर के लिए 0, दूसरे के लिए 1, और इसी तरह)। फिर आप ROW_NUMBER फ़ंक्शन का उपयोग करके बाहरी क्वेरी में वांछित परिणाम अनुक्रम कॉलम की गणना करते हैं। विंडो ऑर्डरिंग के रूप में आप पहले lvl निर्दिष्ट करते हैं, और फिर वांछित ऑर्डरिंग कॉलम (हमारे मामले में empid)। यहाँ संपूर्ण समाधान का कोड है:

DECLARE @root AS INT = 1;
 
WITH C AS
(
  SELECT empid, mgrid, empname, 0 AS lvl
  FROM dbo.Employees
  WHERE empid = @root
 
  UNION ALL
 
  SELECT S.empid, S.mgrid, S.empname, M.lvl + 1 AS lvl
  FROM C AS M
    INNER JOIN dbo.Employees AS S
      ON S.mgrid = M.empid
)
SELECT empid, mgrid, empname,
  ROW_NUMBER() OVER(ORDER BY lvl, empid) AS seqbreadth
FROM C
ORDER BY seqbreadth;

इसके बाद, आइए DEPTH FIRST सर्च ऑर्डर की जांच करें। मानक के अनुसार, निम्नलिखित कोड को कर्मचारी 1 के उपप्रकार को वापस करना चाहिए, एम्पिड द्वारा गहराई से पहले खोज आदेश के लिए पूछना, खोजे गए नोड्स की क्रमिक स्थिति के साथ सेक्डेप नामक अनुक्रम कॉलम बनाना:

DECLARE @root AS INT = 1;
 
WITH C AS
(
  SELECT empid, mgrid, empname
  FROM dbo.Employees
  WHERE empid = @root
 
  UNION ALL
 
  SELECT S.empid, S.mgrid, S.empname
  FROM C AS M
    INNER JOIN dbo.Employees AS S
      ON S.mgrid = M.empid
)
 
SEARCH DEPTH FIRST BY empid SET seqdepth
----------------------------------------
 
SELECT empid, mgrid, empname, seqdepth
FROM C
ORDER BY seqdepth;

इस कोड का वांछित आउटपुट निम्नलिखित है:

empid  mgrid  empname  seqdepth
------ ------ -------- ---------
1      NULL   David    1
2      1      Eitan    2
4      2      Seraph   3
5      2      Jiru     4
8      5      Lilach   5
10     5      Sean     6
6      2      Steve    7
3      1      Ina      8
7      3      Aaron    9
9      7      Rita     10
12     9      Emilia   11
13     9      Michael  12
14     9      Didi     13
11     7      Gabriel  14

वांछित क्वेरी आउटपुट को देखते हुए शायद यह पता लगाना मुश्किल है कि अनुक्रम मानों को जिस तरह से असाइन किया गया था, उन्हें क्यों असाइन किया गया था। चित्रा 3 मदद करनी चाहिए। इसमें कर्मचारी पदानुक्रम का एक ग्राफिकल चित्रण है, जिसमें प्रत्येक बॉक्स के निचले बाएं कोने में निर्दिष्ट अनुक्रम मानों के साथ, एक बिंदीदार रेखा गहराई पहले खोज क्रम को दर्शाती है।

चित्र 3:पहले गहराई खोजें

एक टी-एसक्यूएल समाधान के साथ आना जो मानक खोज गहराई पहले विकल्प के तार्किक समकक्ष प्रदान करता है, थोड़ा मुश्किल है, फिर भी करने योग्य है। मैं दो चरणों में समाधान का वर्णन करूंगा।

चरण 1 में, प्रत्येक नोड के लिए आप एक बाइनरी सॉर्ट पथ की गणना करते हैं जो नोड के प्रति पूर्वज एक सेगमेंट से बना होता है, जिसमें प्रत्येक सेगमेंट अपने भाई-बहनों के बीच पूर्वजों की सॉर्ट स्थिति को दर्शाता है। आप इस पथ का निर्माण उसी तरह करते हैं जैसे आप lvl कॉलम की गणना करते हैं। यही है, एंकर क्वेरी में रूट नोड के लिए एक खाली बाइनरी स्ट्रिंग से शुरू करें। फिर, पुनरावर्ती क्वेरी में आप माता-पिता के पथ को भाई-बहनों के बीच नोड की सॉर्ट स्थिति के साथ जोड़ते हैं, जब आप इसे बाइनरी सेगमेंट में परिवर्तित करते हैं। आप स्थिति की गणना करने के लिए ROW_NUMBER फ़ंक्शन का उपयोग करते हैं, माता-पिता द्वारा विभाजित (हमारे मामले में एमजीग्रिड) और प्रासंगिक ऑर्डरिंग कॉलम (हमारे मामले में एम्पीड) द्वारा आदेशित किया जाता है। आप अपने ग्राफ़ में माता-पिता के प्रत्यक्ष बच्चों की अधिकतम संख्या के आधार पर पंक्ति संख्या को पर्याप्त आकार के बाइनरी मान में परिवर्तित कर सकते हैं। BINARY(1) प्रति माता-पिता 255 बच्चों का समर्थन करता है, BINARY(2) 65,535, BINARY(3):16,777,215, BINARY(4):4,294,967,295 का समर्थन करता है। एक पुनरावर्ती CTE में, एंकर और पुनरावर्ती प्रश्नों में संबंधित कॉलम और आकार के समान होने चाहिए , इसलिए सॉर्ट पथ को दोनों में समान आकार के बाइनरी मान में बदलना सुनिश्चित करें।

हमारे समाधान में चरण 1 को लागू करने वाला कोड यहां दिया गया है (यह मानते हुए कि BINARY(1) प्रति सेगमेंट पर्याप्त है, जिसका अर्थ है कि आपके पास प्रति प्रबंधक 255 से अधिक प्रत्यक्ष अधीनस्थ नहीं हैं):

DECLARE @root AS INT = 1;
 
WITH C AS
(
  SELECT empid, mgrid, empname,
    CAST(0x AS VARBINARY(900)) AS sortpath
  FROM dbo.Employees
  WHERE empid = @root
 
  UNION ALL
 
  SELECT S.empid, S.mgrid, S.empname,
     CAST(M.sortpath
            + CAST(ROW_NUMBER() OVER(PARTITION BY S.mgrid ORDER BY S.empid)
                AS BINARY(1))
       AS VARBINARY(900)) AS sortpath
  FROM C AS M
    INNER JOIN dbo.Employees AS S
      ON S.mgrid = M.empid
)
SELECT empid, mgrid, empname, sortpath
FROM C;

यह कोड निम्न आउटपुट उत्पन्न करता है:

empid  mgrid  empname  sortpath
------ ------ -------- -----------
1      NULL   David    0x
2      1      Eitan    0x01
3      1      Ina      0x02
7      3      Aaron    0x0201
9      7      Rita     0x020101
11     7      Gabriel  0x020102
12     9      Emilia   0x02010101
13     9      Michael  0x02010102
14     9      Didi     0x02010103
4      2      Seraph   0x0101
5      2      Jiru     0x0102
6      2      Steve    0x0103
8      5      Lilach   0x010201
10     5      Sean     0x010202

ध्यान दें कि मैंने एक खाली बाइनरी स्ट्रिंग का उपयोग एकल उपट्री के रूट नोड के लिए सॉर्ट पथ के रूप में किया था जिसे हम यहां क्वेरी कर रहे हैं। यदि एंकर सदस्य संभावित रूप से कई सबट्री रूट वापस कर सकता है, तो बस एक सेगमेंट से शुरू करें जो एंकर क्वेरी में ROW_NUMBER गणना पर आधारित है, जिस तरह से आप इसे रिकर्सिव क्वेरी में गणना करते हैं। ऐसी स्थिति में, आपका क्रमबद्ध पथ एक खंड लंबा होगा।

चरण 2 में क्या करना बाकी है, बाहरी क्वेरी में सॉर्टपाथ द्वारा क्रमबद्ध पंक्ति संख्याओं की गणना करके वांछित परिणाम सेकडेप्थ कॉलम बनाना है, जैसे

DECLARE @root AS INT = 1;
 
WITH C AS
(
  SELECT empid, mgrid, empname,
    CAST(0x AS VARBINARY(900)) AS sortpath
  FROM dbo.Employees
  WHERE empid = @root
 
  UNION ALL
 
  SELECT S.empid, S.mgrid, S.empname,
     CAST(M.sortpath
            + CAST(ROW_NUMBER() OVER(PARTITION BY S.mgrid ORDER BY S.empid)
                AS BINARY(1))
       AS VARBINARY(900)) AS sortpath
  FROM C AS M
    INNER JOIN dbo.Employees AS S
      ON S.mgrid = M.empid
)
SELECT empid, mgrid, empname,
  ROW_NUMBER() OVER(ORDER BY sortpath) AS seqdepth
FROM C
ORDER BY seqdepth;

यह समाधान अपने वांछित आउटपुट के साथ पहले दिखाए गए मानक खोज गहराई पहले विकल्प का उपयोग करने के तार्किक समकक्ष है।

एक बार जब आपके पास एक अनुक्रम स्तंभ होता है जो गहराई से पहले खोज क्रम को दर्शाता है (हमारे मामले में seqdepth), बस थोड़े से अधिक प्रयास से आप पदानुक्रम का एक बहुत अच्छा दृश्य चित्रण उत्पन्न कर सकते हैं। आपको उपरोक्त lvl कॉलम की भी आवश्यकता होगी। आप बाहरी क्वेरी को अनुक्रम स्तंभ द्वारा क्रमित करते हैं। आप कुछ विशेषता लौटाते हैं जिसका उपयोग आप नोड का प्रतिनिधित्व करने के लिए करना चाहते हैं (जैसे, हमारे मामले में empname), कुछ स्ट्रिंग (कहें '|') से पहले lvl बार दोहराया गया। इस तरह के दृश्य चित्रण को प्राप्त करने के लिए यहां पूरा कोड दिया गया है:

DECLARE @root AS INT = 1;
 
WITH C AS
(
  SELECT empid, empname, 0 AS lvl,
    CAST(0x AS VARBINARY(900)) AS sortpath
  FROM dbo.Employees
  WHERE empid = @root
 
  UNION ALL
 
  SELECT S.empid, S.empname, M.lvl + 1 AS lvl,
     CAST(M.sortpath
            + CAST(ROW_NUMBER() OVER(PARTITION BY S.mgrid ORDER BY S.empid)
                AS BINARY(1))
       AS VARBINARY(900)) AS sortpath
  FROM C AS M
    INNER JOIN dbo.Employees AS S
      ON S.mgrid = M.empid
)
SELECT empid,
  ROW_NUMBER() OVER(ORDER BY sortpath) AS seqdepth,
  REPLICATE(' | ', lvl) + empname AS emp
FROM C
ORDER BY seqdepth;

यह कोड निम्न आउटपुट उत्पन्न करता है:

empid  seqdepth  emp
------ --------- --------------------
1      1         David
2      2          | Eitan
4      3          |  | Seraph
5      4          |  | Jiru
8      5          |  |  | Lilach
10     6          |  |  | Sean
6      7          |  | Steve
3      8          | Ina
7      9          |  | Aaron
9      10         |  |  | Rita
12     11         |  |  |  | Emilia
13     12         |  |  |  | Michael
14     13         |  |  |  | Didi
11     14         |  |  | Gabriel

यह बहुत अच्छा है!

चक्र खंड

ग्राफ संरचनाओं में चक्र हो सकते हैं। वे चक्र वैध या अमान्य हो सकते हैं। वैध चक्रों के लिए एक उदाहरण एक ग्राफ है जो शहरों और कस्बों को जोड़ने वाले राजमार्गों और सड़कों का प्रतिनिधित्व करता है। इसे चक्रीय ग्राफ़ . कहा जाता है . इसके विपरीत, एक कर्मचारी पदानुक्रम का प्रतिनिधित्व करने वाले ग्राफ जैसे कि हमारे मामले में चक्र नहीं होना चाहिए। इसे एसाइक्लिक . कहा जाता है ग्राफ। हालाँकि, मान लीजिए कि कुछ गलत अपडेट के कारण, आप अनजाने में एक चक्र के साथ समाप्त हो जाते हैं। उदाहरण के लिए, मान लें कि गलती से आप सीईओ (कर्मचारी 1) की प्रबंधक आईडी को कर्मचारी 14 में निम्नलिखित कोड चलाकर अपडेट कर देते हैं:

UPDATE Employees
  SET mgrid = 14
WHERE empid = 1;

अब आपके पास कर्मचारी पदानुक्रम में एक अमान्य चक्र है।

चाहे चक्र वैध हों या अमान्य, जब आप ग्राफ़ संरचना को पार करते हैं, तो आप निश्चित रूप से बार-बार चक्रीय पथ का अनुसरण नहीं करना चाहते हैं। दोनों ही मामलों में आप एक ही नोड की गैर-प्रथम घटना मिलने के बाद पथ का पीछा करना बंद करना चाहते हैं, और इस तरह के पथ को चक्रीय के रूप में चिह्नित करें।

तो क्या होता है जब आप एक ऐसे ग्राफ को क्वेरी करते हैं जिसमें रिकर्सिव क्वेरी का उपयोग करते हुए चक्र होते हैं, जिनका पता लगाने के लिए कोई तंत्र नहीं होता है? यह कार्यान्वयन पर निर्भर करता है। SQL सर्वर में, किसी बिंदु पर आप अधिकतम रिकर्सन सीमा पर पहुंच जाएंगे, और आपकी क्वेरी निरस्त कर दी जाएगी। उदाहरण के लिए, यह मानते हुए कि आपने उपरोक्त अद्यतन को चलाया है जिसने चक्र का परिचय दिया है, कर्मचारी 1 के उपप्रकार की पहचान करने के लिए निम्नलिखित पुनरावर्ती क्वेरी को चलाने का प्रयास करें:

DECLARE @root AS INT = 1;
 
WITH C AS
(
  SELECT empid, mgrid, empname
  FROM dbo.Employees
  WHERE empid = @root
 
  UNION ALL
 
  SELECT S.empid, S.mgrid, S.empname
  FROM C AS M
    INNER JOIN dbo.Employees AS S
      ON S.mgrid = M.empid
)
SELECT empid, mgrid, empname
FROM C;

चूंकि यह कोड एक स्पष्ट अधिकतम रिकर्सन सीमा निर्धारित नहीं करता है, इसलिए 100 की डिफ़ॉल्ट सीमा मान ली जाती है। SQL सर्वर पूरा होने से पहले इस कोड के निष्पादन को रोकता है और एक त्रुटि उत्पन्न करता है:

empid  mgrid  empname
------ ------ --------
1      14     David
2      1      Eitan
3      1      Ina
7      3      Aaron
9      7      Rita
11     7      Gabriel
12     9      Emilia
13     9      Michael
14     9      Didi
1      14     David
2      1      Eitan
3      1      Ina
7      3      Aaron
...

संदेश 530, स्तर 16, राज्य 1, पंक्ति 432
विवरण समाप्त किया गया। स्टेटमेंट पूरा होने से पहले अधिकतम 100 रिकर्सन समाप्त हो गया है।

SQL मानक पुनरावर्ती CTE के लिए CYCLE नामक एक खंड को परिभाषित करता है, जिससे आप अपने ग्राफ़ में चक्रों से निपटने में सक्षम होते हैं। आप इस क्लॉज को बाहरी क्वेरी के ठीक पहले निर्दिष्ट करते हैं। यदि कोई खोज खंड भी मौजूद है, तो आप इसे पहले निर्दिष्ट करते हैं और फिर चक्र खंड। यहां CYCLE क्लॉज का सिंटैक्स दिया गया है:

साइकिल <चक्र स्तंभ सूची>
<चक्र चिह्न स्तंभ> सेट करें <चक्र चिह्न मान> डिफ़ॉल्ट <गैर-चक्र चिह्न मान>
<पथ स्तंभ> का उपयोग करना

एक चक्र का पता लगाना निर्दिष्ट चक्र स्तंभ सूची . पर आधारित है . उदाहरण के लिए, हमारे कर्मचारी पदानुक्रम में, आप शायद इस उद्देश्य के लिए एम्पीड कॉलम का उपयोग करना चाहेंगे। जब वही एम्पीड मान दूसरी बार प्रकट होता है, तो एक चक्र का पता लगाया जाता है, और क्वेरी आगे ऐसे पथ का अनुसरण नहीं करती है। आप एक नया चक्र चिह्न स्तंभ निर्दिष्ट करें यह इंगित करेगा कि कोई चक्र मिला या नहीं, और चक्र चिह्न . के रूप में आपके स्वयं के मान और गैर-चक्र चिह्न मूल्य। उदाहरण के लिए, वे 1 और 0 या 'हां' और 'नहीं', या आपके द्वारा चुने गए कोई अन्य मान हो सकते हैं। उपयोग खंड में आप एक नया सरणी स्तंभ नाम निर्दिष्ट करते हैं जो अब तक पाए गए नोड्स का पथ धारण करेगा।

यहां बताया गया है कि आप कुछ इनपुट रूट कर्मचारी के अधीनस्थों के लिए एक अनुरोध को कैसे संभालेंगे, एम्पीड कॉलम के आधार पर चक्रों का पता लगाने की क्षमता के साथ, एक चक्र का पता चलने पर चक्र चिह्न कॉलम में 1 इंगित करता है, और 0 अन्यथा:

DECLARE @root AS INT = 1;
 
WITH C AS
(
  SELECT empid, mgrid, empname
  FROM dbo.Employees
  WHERE empid = @root
 
  UNION ALL
 
  SELECT S.empid, S.mgrid, S.empname
  FROM C AS M
    INNER JOIN dbo.Employees AS S
      ON S.mgrid = M.empid
)
 
CYCLE empid SET cycle TO 1 DEFAULT 0
------------------------------------
 
SELECT empid, mgrid, empname
FROM C;

यहां इस कोड का वांछित आउटपुट दिया गया है:

empid  mgrid  empname  cycle
------ ------ -------- ------
1      14     David    0
2      1      Eitan    0
3      1      Ina      0
7      3      Aaron    0
9      7      Rita     0
11     7      Gabriel  0
12     9      Emilia   0
13     9      Michael  0
14     9      Didi     0
1      14     David    1
4      2      Seraph   0
5      2      Jiru     0
6      2      Steve    0
8      5      Lilach   0
10     5      Sean     0

T-SQL वर्तमान में CYCLE क्लॉज का समर्थन नहीं करता है, लेकिन एक वर्कअराउंड है जो एक तार्किक समकक्ष प्रदान करता है। इसमें तीन चरण शामिल हैं। याद रखें कि पहले आपने रिकर्सिव सर्च ऑर्डर को संभालने के लिए बाइनरी सॉर्ट पथ बनाया था। इसी तरह, समाधान में पहले चरण के रूप में, आप एक वर्ण स्ट्रिंग-आधारित पूर्वजों पथ का निर्माण करते हैं जो वर्तमान नोड सहित वर्तमान नोड तक जाने वाले पूर्वजों के नोड आईडी (हमारे मामले में कर्मचारी आईडी) से बना है। आप शुरुआत में एक और अंत में एक सहित, नोड आईडी के बीच विभाजक चाहते हैं।

ऐसे पूर्वजों का पथ बनाने के लिए कोड यहां दिया गया है:

DECLARE @root AS INT = 1;
 
WITH C AS
(
  SELECT empid, mgrid, empname,
    CAST('.' + CAST(empid AS VARCHAR(4)) + '.' AS VARCHAR(900)) AS ancpath
  FROM dbo.Employees
  WHERE empid = @root
 
  UNION ALL
 
  SELECT S.empid, S.mgrid, S.empname,
    CAST(M.ancpath + CAST(S.empid AS VARCHAR(4)) + '.' AS VARCHAR(900)) AS ancpath
  FROM C AS M
    INNER JOIN dbo.Employees AS S
      ON S.mgrid = M.empid
)
SELECT empid, mgrid, empname, ancpath
FROM C;

यह कोड निम्न आउटपुट उत्पन्न करता है, फिर भी चक्रीय पथों का अनुसरण करता है, और इसलिए अधिकतम रिकर्सन सीमा पार हो जाने पर पूरा होने से पहले निरस्त कर दिया जाता है:

empid  mgrid  empname  ancpath
------ ------ -------- -------------------
1      14     David    .1.
2      1      Eitan    .1.2.
3      1      Ina      .1.3.
7      3      Aaron    .1.3.7.
9      7      Rita     .1.3.7.9.
11     7      Gabriel  .1.3.7.11.
12     9      Emilia   .1.3.7.9.12.
13     9      Michael  .1.3.7.9.13.
14     9      Didi     .1.3.7.9.14.
1      14     David    .1.3.7.9.14.1.
2      1      Eitan    .1.3.7.9.14.1.2.
3      1      Ina      .1.3.7.9.14.1.3.
7      3      Aaron    .1.3.7.9.14.1.3.7.
...

संदेश 530, स्तर 16, राज्य 1, पंक्ति 492
विवरण समाप्त किया गया। The maximum recursion 100 has been exhausted before statement completion.

Eyeballing the output, you can identify a cyclic path when the current node appears in the path for the nonfirst time, such as in the path '.1.3.7.9.14.1.' .

In the second step of the solution you produce the cycle mark column. In the anchor query you simply set it to 0 since clearly a cycle cannot be found in the first node. In the recursive member you use a CASE expression that checks with a LIKE-based predicate whether the current node ID already appears in the parent’s path, in which case it returns the value 1, or not, in which case it returns the value 0.

Here’s the code implementing Step 2:

DECLARE @root AS INT = 1;
 
WITH C AS
(
  SELECT empid, mgrid, empname,
    CAST('.' + CAST(empid AS VARCHAR(4)) + '.' AS VARCHAR(900)) AS ancpath,
    0 AS cycle
  FROM dbo.Employees
  WHERE empid = @root
 
  UNION ALL
 
  SELECT S.empid, S.mgrid, S.empname,
    CAST(M.ancpath + CAST(S.empid AS VARCHAR(4)) + '.' AS VARCHAR(900)) AS ancpath,
    CASE WHEN M.ancpath LIKE '%.' + CAST(S.empid AS VARCHAR(4)) + '.%' THEN 1
      ELSE 0 END AS cycle
  FROM C AS M
    INNER JOIN dbo.Employees AS S
      ON S.mgrid = M.empid
)
SELECT empid, mgrid, empname, ancpath, cycle
FROM C;

This code generates the following output, again, still pursuing cyclic paths and failing once the max recursion limit is reached:

empid  mgrid  empname  ancpath             cycle
------ ------ -------- ------------------- ------
1      14     David    .1.                 0
2      1      Eitan    .1.2.               0
3      1      Ina      .1.3.               0
7      3      Aaron    .1.3.7.             0
9      7      Rita     .1.3.7.9.           0
11     7      Gabriel  .1.3.7.11.          0
12     9      Emilia   .1.3.7.9.12.        0
13     9      Michael  .1.3.7.9.13.        0
14     9      Didi     .1.3.7.9.14.        0
1      14     David    .1.3.7.9.14.1.      1
2      1      Eitan    .1.3.7.9.14.1.2.    0
3      1      Ina      .1.3.7.9.14.1.3.    1
7      3      Aaron    .1.3.7.9.14.1.3.7.  1
...

Msg 530, Level 16, State 1, Line 532
The statement terminated. The maximum recursion 100 has been exhausted before statement completion.

The third and last step is to add a predicate to the ON clause of the recursive member that pursues a path only if a cycle was not detected in the parent’s path.

Here’s the code implementing Step 3, which is also the complete solution:

DECLARE @root AS INT = 1;
 
WITH C AS
(
  SELECT empid, mgrid, empname,
    CAST('.' + CAST(empid AS VARCHAR(4)) + '.' AS VARCHAR(900)) AS ancpath,
    0 AS cycle
  FROM dbo.Employees
  WHERE empid = @root
 
  UNION ALL
 
  SELECT S.empid, S.mgrid, S.empname,
    CAST(M.ancpath + CAST(S.empid AS VARCHAR(4)) + '.' AS VARCHAR(900)) AS ancpath,
    CASE WHEN M.ancpath LIKE '%.' + CAST(S.empid AS VARCHAR(4)) + '.%' THEN 1
      ELSE 0 END AS cycle
  FROM C AS M
    INNER JOIN dbo.Employees AS S
      ON S.mgrid = M.empid
      AND M.cycle = 0
)
SELECT empid, mgrid, empname, cycle
FROM C;

This code runs to completion, and generates the following output:

empid  mgrid  empname  cycle
------ ------ -------- -----------
1      14     David    0
2      1      Eitan    0
3      1      Ina      0
7      3      Aaron    0
9      7      Rita     0
11     7      Gabriel  0
12     9      Emilia   0
13     9      Michael  0
14     9      Didi     0
1      14     David    1
4      2      Seraph   0
5      2      Jiru     0
6      2      Steve    0
8      5      Lilach   0
10     5      Sean     0

You identify the erroneous data easily here, and fix the problem by setting the manager ID of the CEO to NULL, like so:

UPDATE Employees
  SET mgrid = NULL
WHERE empid = 1;

Run the recursive query and you will find that there are no cycles present.

निष्कर्ष

Recursive CTEs enable you to write concise declarative solutions for purposes such as traversing graph structures. A recursive CTE has at least one anchor member, which gets executed once, and at least one recursive member, which gets executed repeatedly until it returns an empty result set. Using a query option called MAXRECURSION you can control the maximum number of allowed executions of the recursive member as a safety measure. To limit the executions of the recursive member programmatically for filtering purposes you can maintain a column that tracks the level of the current node with respect to the root node.

The SQL standard supports two very powerful options for recursive CTEs that are currently not available in T-SQL. One is a clause called SEARCH that controls the recursive search order, and another is a clause called CYCLE that detects cycles in the traversed paths. I provided logically equivalent solutions that are currently available in T-SQL. If you find that the unavailable standard features could be important future additions to T-SQL, make sure to vote for them here:

Add support for ISO/IEC SQL SEARCH clause to recursive CTEs in T-SQL
Add support for ISO/IEC SQL CYCLE clause to recursive CTEs in T-SQL

This article concludes the coverage of the logical aspects of CTEs. Next month I’ll turn my attention to physical/performance considerations of CTEs.