Mysql
 sql >> डेटाबेस >  >> RDS >> Mysql

जारो-विंकलर फ़ंक्शन:एक ही स्कोर बहुत समान और बहुत अलग शब्दों से मेल क्यों खाता है?

जारो-विंकलर दूरी सूत्र एक सामान्य शुरुआत के साथ तार के प्रति पक्षपाती है। उदाहरण के लिए, वैलेंटीना और वैलेंटीरिया

इसके कुछ बहुत ही सहज "नियम" भी हैं (देखें विकिपीडिया )।

आपको शायद पहले यह निर्धारित करना चाहिए कि आप किस प्रकार की असमानता की उम्मीद कर रहे हैं, और फिर एक उपयुक्त दूरी सूत्र की तलाश करें। उदाहरण के लिए, लिखित रूप में, "एंगलवर्म" और "एंजलवॉर्म" एक बहुत ही संभावित त्रुटि है, इसलिए दो स्ट्रिंग्स के बीच की दूरी कम होनी चाहिए। जबकि "वहां" और "तीन" बेमेल होने की संभावना कम है और "ईथर" और भी अधिक। लंबे विपर्यय के साथ, जारो दूरी बिल्कुल समान हो सकती है, और यहां तक ​​कि विंकलर सुधार भी शुरू नहीं हो सकता है।

जैसा कि आप इस पेज में पढ़ सकते हैं (जोर मेरा)



  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. एकल कथन में जावा में निष्पादित एकाधिक प्रश्न

  2. MySQL डेटाबेस कैसे बनाएं और विशेषाधिकार कैसे सेट करें

  3. MySQL CONCAT शर्त के साथ चयन करें

  4. MySQL:स्तंभों के एक सेट को विवश करना ताकि कम से कम एक NULL न हो

  5. स्विफ्ट httppost डेटा MySQL डेटाबेस में नहीं डाला जा रहा है