MongoDB $avg एकत्रीकरण पाइपलाइन ऑपरेटर

MongoDB में, $avg एग्रीगेशन पाइपलाइन ऑपरेटर निर्दिष्ट संख्यात्मक मानों के औसत मूल्य की गणना और रिटर्न देता है।

सिंटैक्स

$avg ऑपरेटर दो सिंटैक्स का समर्थन करता है।

सिंटैक्स 1:

{ $avg: <expression> }

सिंटैक्स 2:

{ $avg: [ <expression1>, <expression2> ... ]  }

पहला सिंटैक्स एक तर्क को स्वीकार करता है और दूसरा सिंटैक्स कई तर्कों को स्वीकार करता है।

जब $group . में उपयोग किया जाता है चरण, आप केवल पहले सिंटैक्स का उपयोग कर सकते हैं। इस मामले में, $avg उन सभी सांख्यिक मानों का सामूहिक औसत लौटाता है, जो कुंजी द्वारा समान समूह को साझा करने वाले दस्तावेज़ों के समूह में प्रत्येक दस्तावेज़ में एक निर्दिष्ट अभिव्यक्ति लागू करने के परिणामस्वरूप होते हैं।

सिंटैक्स 1 के उदाहरण (एकल तर्क)

यहां कुछ उदाहरण दिए गए हैं जो सिंटैक्स 1 का उपयोग करते हैं।

समूहीकृत दस्तावेज़

यह उदाहरण $avg . का उपयोग करता है $group . के संयोजन के साथ कुंजी द्वारा समूहीकृत दस्तावेज़ों के समूह में औसत लौटाने के लिए।

मान लीजिए हमारे पास pets . नामक संग्रह है निम्नलिखित दस्तावेजों के साथ:

{ "_id" : 1, "name" : "Wag", "type" : "Dog", "weight" : 20 }
{ "_id" : 2, "name" : "Bark", "type" : "Dog", "weight" : 10 }
{ "_id" : 3, "name" : "Meow", "type" : "Cat", "weight" : 7 }
{ "_id" : 4, "name" : "Scratch", "type" : "Cat", "weight" : 8 }
{ "_id" : 5, "name" : "Bruce", "type" : "Kangaroo", "weight" : 100 }
{ "_id" : 6, "name" : "Hop", "type" : "Kangaroo", "weight" : 130 }
{ "_id" : 7, "name" : "Punch", "type" : "Kangaroo", "weight" : 200 }
{ "_id" : 8, "name" : "Snap", "type" : "Cat", "weight" : 12 }
{ "_id" : 9, "name" : "Ruff", "type" : "Dog", "weight" : 30 }

हम इन दस्तावेज़ों को उनके type . के आधार पर समूहित कर सकते हैं फ़ील्ड, और फिर $avg . का उपयोग करें प्रत्येक समूह का औसत भार वापस करने के लिए:

db.pets.aggregate(
   [
     {
       $group:
          {
            _id: "$type",
            average_weight: { $avg: "$weight" }
          }
     }
   ]
)

परिणाम:

{ "_id" : "Dog", "average_weight" : 20 }
{ "_id" : "Cat", "average_weight" : 9 }
{ "_id" : "Kangaroo", "average_weight" : 143.33333333333334 }

सरणी

यह उदाहरण $avg . पर लागू होता है एक एकल दस्तावेज़ के लिए जिसमें मानों की एक सरणी वाला फ़ील्ड होता है।

यह विकल्प केवल एकल तर्क सिंटैक्स का उपयोग करते समय उपलब्ध होता है। बहु-तर्क सिंटैक्स का उपयोग करते समय सरणियों को अनदेखा कर दिया जाता है (इस पर और अधिक नीचे)।

मान लीजिए हमारे पास players . नामक संग्रह है निम्नलिखित दस्तावेजों के साथ:

{ "_id" : 1, "player" : "Homer", "scores" : [ 1, 7, 2, 3, 8, 7, 1 ] }
{ "_id" : 2, "player" : "Marge", "scores" : [ 0, 1, 8, 17, 18, 8 ] }
{ "_id" : 3, "player" : "Bart", "scores" : [ 15, 11, 8, 0, 1, 3 ] }
{ "_id" : 4, "player" : "Brian", "scores" : [ 7 ] }
{ "_id" : 5, "player" : "Farnsworth", "scores" : [ ] }
{ "_id" : 6, "player" : "Meg", "scores" : null }
{ "_id" : 7, "player" : "Ron" }

हम $avg . लागू कर सकते हैं scores . तक प्रत्येक दस्तावेज़ में फ़ील्ड:

db.players.aggregate(
   [
     {
       $project:
          {
            player: 1,
            averageScore: { $avg: "$scores" }
          }
     }
   ]
)

परिणाम:

{ "_id" : 1, "player" : "Homer", "averageScore" : 4.142857142857143 }
{ "_id" : 2, "player" : "Marge", "averageScore" : 8.666666666666666 }
{ "_id" : 3, "player" : "Bart", "averageScore" : 6.333333333333333 }
{ "_id" : 4, "player" : "Brian", "averageScore" : 7 }
{ "_id" : 5, "player" : "Farnsworth", "averageScore" : null }
{ "_id" : 6, "player" : "Meg", "averageScore" : null }
{ "_id" : 7, "player" : "Ron", "averageScore" : null }

इस मामले में, पहले चार दस्तावेज़ों ने विभिन्न संख्याओं का औसत लौटाया जो उनके संबंधित सरणियों में थे।

दस्तावेज़ 4 के मामले में, यह संख्या के समान ही था, क्योंकि सरणी में केवल एक ही संख्या थी।

दस्तावेज़ 5 लौटा null क्योंकि हमने एक खाली सरणी प्रदान की है।

दस्तावेज़ 6 लौटा null क्योंकि हमने null प्रदान किया है तर्क के रूप में।

दस्तावेज़ 7 लौटा null क्योंकि फ़ील्ड मौजूद ही नहीं था।

सिंटैक्स 2 का उदाहरण (एकाधिक तर्क)

दूसरे सिंटैक्स में $avg . प्रदान करना शामिल है एक से अधिक तर्क के साथ। $avg फिर सभी दिए गए तर्कों के आधार पर औसत की गणना करता है।

मान लीजिए हमारे पास data . नामक संग्रह है निम्नलिखित दस्तावेजों के साथ:

{ "_id" : 1, "a" : 1, "b" : 2, "c" : 3, "d" : 4 }
{ "_id" : 2, "a" : 1, "b" : 2, "c" : 3, "d" : [ 4 ] }
{ "_id" : 3, "a" : 1, "b" : 2, "c" : 3, "d" : "Hey" }
{ "_id" : 4, "a" : "One", "b" : "Two", "c" : "Three", "d" : "Four" }

हम $avg . का उपयोग कर सकते हैं a . का औसत लौटाने के लिए , b , c , और d प्रत्येक दस्तावेज़ के क्षेत्र:

db.data.aggregate(
   [
     {
       $project:
          {
            avg: { $avg: [ "$a", "$b", "$c", "$d" ] }
          }
     }
   ]
)

परिणाम:

{ "_id" : 1, "avg" : 2.5 }
{ "_id" : 2, "avg" : 2 }
{ "_id" : 3, "avg" : 2 }
{ "_id" : 4, "avg" : null }

दस्तावेज़ 1 1 . के इनपुट मानों का औसत लौटाता है , 2 , 3 , और 4 ।

हालांकि, अगले दो दस्तावेज़ों ने केवल 1 . के इनपुट मानों का औसत लौटाया , 2 , और 3 . $avg ऑपरेटर ने उनके d . पर ध्यान नहीं दिया खेत।

ऐसा इसलिए है क्योंकि $avg गैर-संख्यात्मक मानों की उपेक्षा करता है। तो इस मामले में यह नजरअंदाज कर दिया "Hey" दस्तावेज़ 3 में और शेष (संख्यात्मक) फ़ील्ड से औसत की गणना की।

दस्तावेज़ 2 के लिए, इसका d फ़ील्ड में एक सरणी है। जैसा कि बताया गया है, $avg बहु-तर्क सिंटैक्स का उपयोग करते समय ऑपरेटर सरणियों को अनदेखा करता है। अधिक सटीक रूप से, यह इस संदर्भ में उपयोग किए जाने पर सरणियों को गैर-संख्यात्मक मानों के रूप में मानता है, और $avg गैर-संख्यात्मक मानों की उपेक्षा करता है।

यदि सभी मान गैर-संख्यात्मक हैं, तो $avg रिटर्न null . हम इसे दस्तावेज़ 4 के साथ देख सकते हैं।

अनुपलब्ध फ़ील्ड

बहु-तर्क सिंटैक्स का उपयोग करते समय, $avg किसी भी लापता फ़ील्ड को अनदेखा करता है। यही है, यदि आप किसी ऐसे क्षेत्र की आपूर्ति करते हैं जो मौजूद नहीं है, तो वह इसे अनदेखा कर देता है। यदि कोई भी फ़ील्ड मौजूद नहीं है, तो यह null लौटाता है ।

उदाहरण:

db.data.aggregate(
   [
     {
       $project:
          {
            avg: { $avg: [ "$a", "$b", "$c", "$d", "$e" ] }
          }
     }
   ]
)

परिणाम:

{ "_id" : 1, "avg" : 2.5 }
{ "_id" : 2, "avg" : 2 }
{ "_id" : 3, "avg" : 2 }
{ "_id" : 4, "avg" : null }

इस मामले में मैंने एक अतिरिक्त क्षेत्र प्रदान किया ($e ) जो दस्तावेजों में मौजूद नहीं है। $avg शेष फ़ील्ड के आधार पर औसत की गणना की जो करते हैं मौजूद है।

हालांकि, यहां क्या होता है जब कोई नहीं फ़ील्ड मौजूद हैं:

db.data.aggregate(
   [
     {
       $project:
          {
            result: { $avg: [ "$x", "$y", "$z" ] }
          }
     }
   ]
)

परिणाम:

{ "_id" : 1, "result" : null }
{ "_id" : 2, "result" : null }
{ "_id" : 3, "result" : null }
{ "_id" : 4, "result" : null }

परिणाम null है सभी दस्तावेजों के लिए।

जैसा कि हमने पहले देखा, एकल-तर्क सिंटैक्स का उपयोग करते समय, एक अनुपलब्ध फ़ील्ड का परिणाम null होता है ।

उदाहरण:

db.pets.aggregate(
   [
     {
       $group:
          {
            _id: "$type",
            avg: { $avg: "$oops!" }
          }
     }
   ]
)

परिणाम:

{ "_id" : "Kangaroo", "avg" : null }
{ "_id" : "Cat", "avg" : null }
{ "_id" : "Dog", "avg" : null }

उपलब्ध चरण

$avg निम्नलिखित चरणों में उपलब्ध है:

$group
$project
$addFields
$set
$replaceRoot
$replaceWith
$match चरण जिसमें एक $expr . शामिल है अभिव्यक्ति