ठीक है मैंने समस्या का पता लगा लिया। यह वर्कर टाइमआउट के कारण था।
try:
--my code goes here--
except Exception, ex:
self.error += 1
with open("error.txt", "a") as myfile:
myfile.write('\n%s' % sys.exc_info()[0] + "{}".format(self.url))
pass
तो मेरे कोड के अनुसार, यदि प्रत्येक डोमेन से 200 यूआरएल प्राप्त किए जाते हैं तो अगला डोमेन हटा दिया जाता है। लेकिन कुछ डोमेन के लिए शर्त को समाप्त करने के लिए पर्याप्त संख्या में url नहीं थे (जैसे केवल 1 या 2 url)।
चूंकि कोड सभी अपवादों को पकड़ लेता है और error.txt . में जुड़ जाता है फ़ाइल। यहां तक कि rq टाइमआउट अपवाद rq.timeouts.JobTimeoutException पकड़ा गया और फाइल में जोड़ा गया। इस प्रकार कार्यकर्ता को x . के लिए प्रतीक्षा करना पड़ता है समय की राशि, जिसके कारण कर्मचारी को बर्खास्त कर दिया जाता है।