HyperLogLog
अद्वितीय वस्तुओं की गणना के लिए उपयोग किया जाता है। यह थोड़ी मेमोरी के साथ बड़ी संख्या में आइटम गिन सकता है। हालांकि, लौटाई गई कार्डिनैलिटी सटीक नहीं है, लेकिन एक standard error
के साथ अनुमानित है ।
0.81% standard error
है , झूठी सकारात्मक नहीं। आपके उदाहरण के लिए, आप PFCOUNT HLL
. पर कॉल कर सकते हैं HyperLogLog
. में आपके द्वारा डाले गए अद्वितीय आइटम की अनुमानित संख्या प्राप्त करने के लिए . लौटाई गई संख्या [10000 * (1 - 0.81%), 10000 * (1 + 0.81%)]
की सीमा में होनी चाहिए ।
PFADD
यदि कमांड निष्पादित करने के बाद अनुमानित कार्डिनैलिटी बदल जाती है तो 1 लौटाता है। यह 0 देता है, अन्यथा। इसका false positive
से कोई लेना-देना नहीं है ।
ऐसा लगता है कि आपको ब्लूम फ़िल्टर की आवश्यकता है, जो आपको बता सकता है कि डेटा सेट में कोई आइटम पहले से मौजूद है, जिसमें झूठी सकारात्मक है। आप एक Bloom Filter
लागू कर सकते हैं रेडिस के साथ, बिल्कुल। और उसके लिए कुछ ओपन सोर्स प्रोजेक्ट होना चाहिए।