आपका प्रश्न कल्पना के लिए बहुत कुछ छोड़ देता है।
एक बात के लिए हमें यह मान लेना चाहिए कि आपके सूचकांक का उद्देश्य डुप्लीकेट से बचने के लिए प्राथमिक कुंजी के रूप में कार्य करना है। आप ऐसा एप्लिकेशन विकसित नहीं कर रहे होंगे जो कभी किसी उपयोगकर्ता से कहे, "क्षमा करें, आपकी 1800-वर्ण डेटा प्रविष्टि में कोई त्रुटि है; यह मेल नहीं खाता, कृपया पुन:प्रयास करें।"
दूसरी बात के लिए, हमें यह मान लेना चाहिए कि आपके इन URL में संभावित रूप से बहुत सारे CGI पैरामीटर (?param=val¶m=val¶m=val) हैं।
यदि ये धारणाएँ सत्य हैं, तो आप यहाँ क्या कर सकते हैं।
-
यदि आपको आवश्यकता हो, तो अपने URL कॉलम को एक वर्चर के रूप में लंबा बनाएं।
-
अपनी तालिका में SHA-1 हैश कॉलम जोड़ें। SHA-1 हैश में 40 वर्णों (हेक्सडिजिट) के तार होते हैं।
-
उस कॉलम को अपनी प्राथमिक कुंजी बनाएं।
-
जब आप अपनी तालिका में सामान रखते हैं, तो हैश मानों की गणना करने के लिए mySQL SHA1 फ़ंक्शन का उपयोग करें।
-
अपने डेटाबेस में पंक्तियाँ जोड़ने के लिए INSERT ... ON DUPLICATE KEY UPDATE mySQL कमांड का उपयोग करें।
यह आपको बिना किसी भ्रम के अपने डेटा बेस से डुप्लीकेट URL को इस तरह से बाहर रखने देगा जो अच्छी तरह से बढ़ जाए।
http://dev.mysql.com/doc /refman/5.1/hi/insert-on-duplicate.html