MongoDB में, $avg
एग्रीगेशन पाइपलाइन ऑपरेटर निर्दिष्ट संख्यात्मक मानों के औसत मूल्य की गणना और रिटर्न देता है।
सिंटैक्स
$avg
ऑपरेटर दो सिंटैक्स का समर्थन करता है।
सिंटैक्स 1:
{ $avg: <expression> }
सिंटैक्स 2:
{ $avg: [ <expression1>, <expression2> ... ] }
पहला सिंटैक्स एक तर्क को स्वीकार करता है और दूसरा सिंटैक्स कई तर्कों को स्वीकार करता है।
जब $group
. में उपयोग किया जाता है चरण, आप केवल पहले सिंटैक्स का उपयोग कर सकते हैं। इस मामले में, $avg
उन सभी सांख्यिक मानों का सामूहिक औसत लौटाता है, जो कुंजी द्वारा समान समूह को साझा करने वाले दस्तावेज़ों के समूह में प्रत्येक दस्तावेज़ में एक निर्दिष्ट अभिव्यक्ति लागू करने के परिणामस्वरूप होते हैं।
सिंटैक्स 1 के उदाहरण (एकल तर्क)
यहां कुछ उदाहरण दिए गए हैं जो सिंटैक्स 1 का उपयोग करते हैं।
समूहीकृत दस्तावेज़
यह उदाहरण $avg
. का उपयोग करता है $group
. के संयोजन के साथ कुंजी द्वारा समूहीकृत दस्तावेज़ों के समूह में औसत लौटाने के लिए।
मान लीजिए हमारे पास pets
. नामक संग्रह है निम्नलिखित दस्तावेजों के साथ:
{ "_id" : 1, "name" : "Wag", "type" : "Dog", "weight" : 20 } { "_id" : 2, "name" : "Bark", "type" : "Dog", "weight" : 10 } { "_id" : 3, "name" : "Meow", "type" : "Cat", "weight" : 7 } { "_id" : 4, "name" : "Scratch", "type" : "Cat", "weight" : 8 } { "_id" : 5, "name" : "Bruce", "type" : "Kangaroo", "weight" : 100 } { "_id" : 6, "name" : "Hop", "type" : "Kangaroo", "weight" : 130 } { "_id" : 7, "name" : "Punch", "type" : "Kangaroo", "weight" : 200 } { "_id" : 8, "name" : "Snap", "type" : "Cat", "weight" : 12 } { "_id" : 9, "name" : "Ruff", "type" : "Dog", "weight" : 30 }
हम इन दस्तावेज़ों को उनके type
. के आधार पर समूहित कर सकते हैं फ़ील्ड, और फिर $avg
. का उपयोग करें प्रत्येक समूह का औसत भार वापस करने के लिए:
db.pets.aggregate(
[
{
$group:
{
_id: "$type",
average_weight: { $avg: "$weight" }
}
}
]
)
परिणाम:
{ "_id" : "Dog", "average_weight" : 20 } { "_id" : "Cat", "average_weight" : 9 } { "_id" : "Kangaroo", "average_weight" : 143.33333333333334 }
सरणी
यह उदाहरण $avg
. पर लागू होता है एक एकल दस्तावेज़ के लिए जिसमें मानों की एक सरणी वाला फ़ील्ड होता है।
यह विकल्प केवल एकल तर्क सिंटैक्स का उपयोग करते समय उपलब्ध होता है। बहु-तर्क सिंटैक्स का उपयोग करते समय सरणियों को अनदेखा कर दिया जाता है (इस पर और अधिक नीचे)।
मान लीजिए हमारे पास players
. नामक संग्रह है निम्नलिखित दस्तावेजों के साथ:
{ "_id" : 1, "player" : "Homer", "scores" : [ 1, 7, 2, 3, 8, 7, 1 ] } { "_id" : 2, "player" : "Marge", "scores" : [ 0, 1, 8, 17, 18, 8 ] } { "_id" : 3, "player" : "Bart", "scores" : [ 15, 11, 8, 0, 1, 3 ] } { "_id" : 4, "player" : "Brian", "scores" : [ 7 ] } { "_id" : 5, "player" : "Farnsworth", "scores" : [ ] } { "_id" : 6, "player" : "Meg", "scores" : null } { "_id" : 7, "player" : "Ron" }
हम $avg
. लागू कर सकते हैं scores
. तक प्रत्येक दस्तावेज़ में फ़ील्ड:
db.players.aggregate(
[
{
$project:
{
player: 1,
averageScore: { $avg: "$scores" }
}
}
]
)
परिणाम:
{ "_id" : 1, "player" : "Homer", "averageScore" : 4.142857142857143 } { "_id" : 2, "player" : "Marge", "averageScore" : 8.666666666666666 } { "_id" : 3, "player" : "Bart", "averageScore" : 6.333333333333333 } { "_id" : 4, "player" : "Brian", "averageScore" : 7 } { "_id" : 5, "player" : "Farnsworth", "averageScore" : null } { "_id" : 6, "player" : "Meg", "averageScore" : null } { "_id" : 7, "player" : "Ron", "averageScore" : null }
इस मामले में, पहले चार दस्तावेज़ों ने विभिन्न संख्याओं का औसत लौटाया जो उनके संबंधित सरणियों में थे।
दस्तावेज़ 4 के मामले में, यह संख्या के समान ही था, क्योंकि सरणी में केवल एक ही संख्या थी।
दस्तावेज़ 5 लौटा null
क्योंकि हमने एक खाली सरणी प्रदान की है।
दस्तावेज़ 6 लौटा null
क्योंकि हमने null
प्रदान किया है तर्क के रूप में।
दस्तावेज़ 7 लौटा null
क्योंकि फ़ील्ड मौजूद ही नहीं था।
सिंटैक्स 2 का उदाहरण (एकाधिक तर्क)
दूसरे सिंटैक्स में $avg
. प्रदान करना शामिल है एक से अधिक तर्क के साथ। $avg
फिर सभी दिए गए तर्कों के आधार पर औसत की गणना करता है।
मान लीजिए हमारे पास data
. नामक संग्रह है निम्नलिखित दस्तावेजों के साथ:
{ "_id" : 1, "a" : 1, "b" : 2, "c" : 3, "d" : 4 } { "_id" : 2, "a" : 1, "b" : 2, "c" : 3, "d" : [ 4 ] } { "_id" : 3, "a" : 1, "b" : 2, "c" : 3, "d" : "Hey" } { "_id" : 4, "a" : "One", "b" : "Two", "c" : "Three", "d" : "Four" }
हम $avg
. का उपयोग कर सकते हैं a
. का औसत लौटाने के लिए , b
, c
, और d
प्रत्येक दस्तावेज़ के क्षेत्र:
db.data.aggregate(
[
{
$project:
{
avg: { $avg: [ "$a", "$b", "$c", "$d" ] }
}
}
]
)
परिणाम:
{ "_id" : 1, "avg" : 2.5 } { "_id" : 2, "avg" : 2 } { "_id" : 3, "avg" : 2 } { "_id" : 4, "avg" : null }
दस्तावेज़ 1 1
. के इनपुट मानों का औसत लौटाता है , 2
, 3
, और 4
।
हालांकि, अगले दो दस्तावेज़ों ने केवल 1
. के इनपुट मानों का औसत लौटाया , 2
, और 3
. $avg
ऑपरेटर ने उनके d
. पर ध्यान नहीं दिया खेत।
ऐसा इसलिए है क्योंकि $avg
गैर-संख्यात्मक मानों की उपेक्षा करता है। तो इस मामले में यह नजरअंदाज कर दिया "Hey"
दस्तावेज़ 3 में और शेष (संख्यात्मक) फ़ील्ड से औसत की गणना की।
दस्तावेज़ 2 के लिए, इसका d
फ़ील्ड में एक सरणी है। जैसा कि बताया गया है, $avg
बहु-तर्क सिंटैक्स का उपयोग करते समय ऑपरेटर सरणियों को अनदेखा करता है। अधिक सटीक रूप से, यह इस संदर्भ में उपयोग किए जाने पर सरणियों को गैर-संख्यात्मक मानों के रूप में मानता है, और $avg
गैर-संख्यात्मक मानों की उपेक्षा करता है।
यदि सभी मान गैर-संख्यात्मक हैं, तो $avg
रिटर्न null
. हम इसे दस्तावेज़ 4 के साथ देख सकते हैं।
अनुपलब्ध फ़ील्ड
बहु-तर्क सिंटैक्स का उपयोग करते समय, $avg
किसी भी लापता फ़ील्ड को अनदेखा करता है। यही है, यदि आप किसी ऐसे क्षेत्र की आपूर्ति करते हैं जो मौजूद नहीं है, तो वह इसे अनदेखा कर देता है। यदि कोई भी फ़ील्ड मौजूद नहीं है, तो यह null
लौटाता है ।
उदाहरण:
db.data.aggregate(
[
{
$project:
{
avg: { $avg: [ "$a", "$b", "$c", "$d", "$e" ] }
}
}
]
)
परिणाम:
{ "_id" : 1, "avg" : 2.5 } { "_id" : 2, "avg" : 2 } { "_id" : 3, "avg" : 2 } { "_id" : 4, "avg" : null }
इस मामले में मैंने एक अतिरिक्त क्षेत्र प्रदान किया ($e
) जो दस्तावेजों में मौजूद नहीं है। $avg
शेष फ़ील्ड के आधार पर औसत की गणना की जो करते हैं मौजूद है।
हालांकि, यहां क्या होता है जब कोई नहीं फ़ील्ड मौजूद हैं:
db.data.aggregate(
[
{
$project:
{
result: { $avg: [ "$x", "$y", "$z" ] }
}
}
]
)
परिणाम:
{ "_id" : 1, "result" : null } { "_id" : 2, "result" : null } { "_id" : 3, "result" : null } { "_id" : 4, "result" : null }
परिणाम null
है सभी दस्तावेजों के लिए।
जैसा कि हमने पहले देखा, एकल-तर्क सिंटैक्स का उपयोग करते समय, एक अनुपलब्ध फ़ील्ड का परिणाम null
होता है ।
उदाहरण:
db.pets.aggregate(
[
{
$group:
{
_id: "$type",
avg: { $avg: "$oops!" }
}
}
]
)
परिणाम:
{ "_id" : "Kangaroo", "avg" : null } { "_id" : "Cat", "avg" : null } { "_id" : "Dog", "avg" : null }
उपलब्ध चरण
$avg
निम्नलिखित चरणों में उपलब्ध है:
$group
$project
$addFields
$set
$replaceRoot
$replaceWith
$match
चरण जिसमें एक$expr
. शामिल है अभिव्यक्ति