Mysql
 sql >> डेटाबेस >  >> RDS >> Mysql

वेबसाइट डेटाबेस से 'डेटा स्क्रैपिंग' से बचने के लिए शीर्ष तकनीकें

जबकि एक दृढ़ निश्चयी व्यक्ति को सार्वजनिक रूप से उपलब्ध सामग्री को स्क्रैप करने से रोकने के लिए कुछ भी नहीं है, आप क्लाइंट की चिंताओं को कम करने के लिए कुछ बुनियादी चीजें कर सकते हैं:

  • उपयोगकर्ता खाते, आईपी पते, उपयोगकर्ता एजेंट, आदि द्वारा दर सीमा... - इसका मतलब है कि आप किसी विशेष उपयोगकर्ता समूह द्वारा एक निश्चित अवधि में डाउनलोड किए जा सकने वाले डेटा की मात्रा को सीमित कर सकते हैं। यदि आपको पता चलता है कि बड़ी मात्रा में डेटा स्थानांतरित किया जा रहा है, तो आप खाता या आईपी पता बंद कर देते हैं।

  • जावास्क्रिप्ट की आवश्यकता है - यह सुनिश्चित करने के लिए कि क्लाइंट के पास एक बेयरबोन स्पाइडर के बजाय एक इंटरैक्टिव ब्राउज़र जैसा कुछ है...

  • आरआईए - अपने डेटा को एक रिच इंटरनेट एप्लिकेशन इंटरफ़ेस के माध्यम से उपलब्ध कराएं। JavaScript-आधारित ग्रिड में ExtJs, YUI, Dojo, आदि शामिल हैं। समृद्ध वातावरण में Flash और Silverlight शामिल हैं जैसे 1kevgriff उल्लेख

  • छवियों के रूप में डेटा एन्कोड करें। यह नियमित उपयोगकर्ताओं के लिए बहुत कठिन है, लेकिन आप अपने कुछ डेटा टेबल या मानों को टेक्स्ट के बजाय छवियों के रूप में एन्कोड कर सकते हैं, जो अधिकांश टेक्स्ट पार्सर्स को हरा देगा, लेकिन निश्चित रूप से मूर्खतापूर्ण नहीं है।

  • robots.txt - स्पष्ट वेब स्पाइडर, ज्ञात रोबोट उपयोगकर्ता एजेंटों से इनकार करने के लिए।

    उपयोगकर्ता-एजेंट:**

    अनुमति न दें:/

  • रोबोट मेटाटैग का प्रयोग करें। यह मकड़ियों के अनुरूप होना बंद कर देगा। यह उदाहरण के लिए Google को आपको अनुक्रमित करने से रोकेगा:

निरोध के विभिन्न स्तर हैं और पहला विकल्प शायद सबसे कम दखल देने वाला है।



  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. एक निश्चित तिथि से पहले रिकॉर्ड हटाना

  2. PHP, MySQL, आदि में तिथियों को प्रबंधित करने का सबसे अच्छा तरीका क्या है?

  3. PDO::FETCH_ASSOC सब कुछ नहीं ला रहा है

  4. MySQL में अनुक्रमिक संख्या डालें

  5. क्या एक सबक्वायरी के लिए दो मान वापस करना संभव है?