एकत्रीकरण के दौरान मिलान क्वेरी के आसपास विभाजन डेटा

यह एकत्रीकरण वांछित परिणाम देता है।

db.posts.aggregate( [
{ $match:  { updatedAt: { $gte: 1549786260000 } } },
{ $facet: {
        FALSE: [
            { $match: { toggle: false } },
            { $unwind : "$interests" },
            { $group : { _id : { iid: "$interests", pid: "$publisher" }, count: { $sum : 1 } } },
        ],
        TRUE: [
            { $match: { toggle: true, status: "INACTIVE" } },
            { $unwind : "$interests" },
            { $group : { _id : { iid: "$interests", pid: "$publisher" }, count: { $sum : -1 } } },
        ]
} },
{ $project: { result: { $concatArrays: [ "$FALSE", "$TRUE" ] } } },
{ $unwind: "$result" },
{ $replaceRoot: { newRoot: "$result" } },
{ $group : { _id : "$_id", count: { $sum : "$count" } } },
{ $project:{ _id: 0, iid: "$_id.iid", pid: "$_id.pid", count: 1 } }
] )

[जोड़ें संपादित करें]

प्रश्न पोस्ट से इनपुट डेटा का उपयोग कर क्वेरी से आउटपुट:

{ "count" : 1, "iid" : "INT123", "pid" : "P789" }
{ "count" : 1, "iid" : "INT123", "pid" : "P123" }
{ "count" : 0, "iid" : "INT789", "pid" : "P789" }
{ "count" : 1, "iid" : "INT456", "pid" : "P789" }

[संपादित करें 2 जोड़ें]

इस क्वेरी को अलग-अलग दृष्टिकोण (कोड) के साथ एक ही परिणाम मिलता है:

db.posts.aggregate( [
  { 
      $match:  { updatedAt: { $gte: 1549786260000 } } 
  },
  { 
      $unwind : "$interests" 
  },
  { 
      $group : { 
          _id : { 
              iid: "$interests", 
              pid: "$publisher" 
          }, 
          count: { 
              $sum: {
                  $switch: {
                      branches: [
                        { case: { $eq: [ "$toggle", false ] },
                           then: 1 },
                        { case: { $and: [ { $eq: [ "$toggle", true] },  { $eq: [ "$status", "INACTIVE" ] } ] },
                           then: -1 }
                      ]
                  }          
              } 
          }
      } 
  },
  { 
      $project:{
           _id: 0, 
           iid: "$_id.iid", 
           pid: "$_id.pid", 
           count: 1 
      } 
  }
] )

[संपादित करें 3 जोड़ें]

नोट:

पहलू क्वेरी दस्तावेज़ों के एक ही सेट पर दो पहलुओं (TRUE और FALSE) को चलाती है; यह समानांतर में चल रहे दो प्रश्नों की तरह है। लेकिन, वांछित आउटपुट प्राप्त करने के लिए पाइपलाइन के नीचे दस्तावेजों को आकार देने के लिए कोड के कुछ दोहराव के साथ-साथ अतिरिक्त चरण भी हैं।

दूसरी क्वेरी कोड दोहराव से बचाती है, और एकत्रीकरण पाइपलाइन में बहुत कम चरण होते हैं। इससे फर्क पड़ेगा जब प्रदर्शन के संदर्भ में इनपुट डेटासेट में बड़ी संख्या में दस्तावेज़ संसाधित करने के लिए होते हैं। सामान्य तौर पर, कम चरणों का अर्थ है दस्तावेज़ों की कम पुनरावृत्तियों (एक चरण के रूप में उन दस्तावेज़ों को स्कैन करना होता है जो पिछले चरण से आउटपुट होते हैं)।