Mysql
 sql >> डेटाबेस >  >> RDS >> Mysql

वर्डनेट एसक्यूएल स्पष्टीकरण

वर्डनेट एक सुपर कूल वर्ड डेटाबेस है। मैं खुद इस पर शोध कर रहा हूं। मैं अपने निष्कर्षों को नीचे सूचीबद्ध करूंगा - और उम्मीद है कि इससे आपको तालिकाओं को बेहतर ढंग से समझने में मदद मिलेगी।

सिंसेट टेबल सिंकसेट तालिका डेटाबेस में सबसे महत्वपूर्ण तालिकाओं में से एक है। यह वर्डनेट के भीतर सभी परिभाषाओं को रखने के लिए जिम्मेदार है। सिनसेट टेबल की प्रत्येक पंक्ति में एक सिनसेटिड, एक परिभाषा, एक पॉज़ (भाषण क्षेत्र के हिस्से) और एक लेक्सडोमेनिड (जो लेक्सडोमेन टेबल से लिंक होता है) वर्डनेट डेटाबेस में 117373 सिंक होते हैं।

शब्द तालिका वर्डनेट में एक "शब्द" तालिका भी होती है, जिसमें केवल दो फ़ील्ड होते हैं:एक वर्डिड, और एक "लेम्मा"। वर्डनेट डेटाबेस के भीतर सभी लेम्मा (आधार शब्द) को रखने के लिए शब्द तालिका जिम्मेदार है। इस तालिका में 146625 प्रविष्टियां हैं

तो .. ये दो टेबल कैसे जुड़े हुए हैं? उत्तर? सेंस टेबल!

द सेंस टेबल सेंस टेबल शब्दों (शब्द तालिका में) को परिभाषाओं के साथ जोड़ने के लिए जिम्मेदार है (सिंसेट टेबल में)। अर्थ तालिका में प्रविष्टियों को "शब्द-भावना जोड़े" के रूप में संदर्भित किया जाता है - क्योंकि एक सिंसेट के साथ एक वर्डिड की प्रत्येक जोड़ी एक शब्द का एक पूर्ण अर्थ है - एक "शब्द की भावना"।
वर्डनेट डेटाबेस में कुल 206,354 शब्द इंद्रियां हैं।

लेक्सडोमेन तालिका Lexdomains तालिका को अर्थ तालिका द्वारा संदर्भित किया जाता है, और इसका उपयोग यह परिभाषित करने के लिए किया जाता है कि शब्द-अर्थ जोड़ी किस लेक्सिकल डोमेन से संबंधित है। लेक्सडोमेन टेबल में 45 लेक्सिकल डोमेन हैं। इसलिए लेक्सडोमेन टेबल, वर्डनेट का वर्ड-सेंस पेयर "टैगिंग" करने का तरीका है। हालाँकि, यह काफी सीमित है, क्योंकि एक शब्द-बोध जोड़ी केवल एक लेक्सिकल डोमेन से संबंधित हो सकती है।

45 शाब्दिक डोमेन में शामिल हैं:

विशेषण: सभी, पर्ट

क्रिया विशेषण सभी

संज्ञाएं सबसे ऊपर, कार्य, पशु, कलाकृति, विशेषता, शरीर, अनुभूति, संचार, घटना, भावना, भोजन, समूह, स्थान, मकसद, वस्तु, व्यक्ति, घटना, पौधे, अधिकार, प्रक्रिया, मात्रा, लिंकडेफ, आकार, राज्य, पदार्थ समय,

क्रियाएं शरीर, परिवर्तन, अनुभूति, संचार, प्रतिस्पर्धा, उपभोग, संपर्क, सृजन, भावना, गति, धारणा, अधिकार, सामाजिक, स्थिर, मौसम, पीपीएल

केसवर्ड्स तालिका शब्द तालिका के भीतर कुछ शब्दों में स्वाभाविक रूप से पहला अक्षर बड़ा होता है यानी:"ए-टीम"। चूंकि शब्द तालिका सभी शब्दों को लोअरकेस के रूप में संग्रहीत करती है, वर्डनेट शब्द के अपरकेस संस्करण को निर्दिष्ट करने के लिए इस तालिका का उपयोग करता है। इस तालिका में 40313 प्रविष्टियां हैं।

वर्डनेट डीबी में कई अन्य टेबल हैं, एक बार जब मैंने उन्हें शोध किया है, तो मैं फिर से पोस्ट करूंगा।

वर्ष के समानार्थी शब्द ढूँढना समानार्थक शब्द के संबंध में अपने प्रश्न का उत्तर देने के लिए - आपको निम्न कार्य करने होंगे।

मान लीजिए कि आप "कैरी" शब्द के लिए समानार्थी शब्द खोजना चाहते हैं। ऐसा करने के लिए, आप पहले शब्द तालिका में "कैरी" शब्द से मेल खाने वाले लेम्मा की खोज करेंगे। इससे वर्डिड 21253 प्राप्त होगा। फिर आप शब्द-संवेदी जोड़े को कैरी शब्द के लिए खोजने के लिए, इंद्रियों की तालिका को खोजेंगे। इससे 41 परिणाम मिलते हैं - प्रत्येक परिणाम में वर्डिड 21253, और एक सेंसिड (जो शब्द-बोध जोड़ी का सूचकांक है) और एक सिनसेटिड सूचीबद्ध होता है।

अब, आपको प्रत्येक सिनसेटिड की वापसी के लिए सिनसेट तालिका को क्वेरी करने की आवश्यकता होगी ताकि आप सिनसेट तालिका में संबंधित परिभाषा फ़ील्ड तक पहुंच सकें।

अंत में सूचीबद्ध प्रत्येक सिनसेट के लिए समानार्थक शब्द खोजने के लिए, आपको बस अन्य शब्द-संवेदी युग्मों के लिए अर्थ तालिका खोजने की आवश्यकता होगी जो समान सिनसेट साझा करते हैं।

उदाहरण:"कैरी" शब्द के लिए 41 शब्द-अर्थ जोड़े में से एक नीचे सूचीबद्ध है:अगर हम इस सिनसेटिड 202083512 की परिभाषा देखें, तो आप पाएंगे कि "ट्रांसमिट या ट्रांसमिशन के लिए माध्यम के रूप में काम करता है"

इस परिभाषा के लिए सभी समानार्थक शब्द खोजने के लिए, आप उसी सिनसेटिड 202083512 के लिए अर्थ तालिका खोजेंगे। यह समानार्थक शब्द उत्पन्न करता है:चैनल, आचरण, संदेश, प्रदान, और संचारित (नोट:आपको प्राप्त करने के लिए शब्द तालिका में शामिल होने की आवश्यकता होगी वास्तविक नींबू)

मुझे आशा है कि यह आपके लिए वर्डनेट को रहस्यमय बनाने में मदद करेगा.. मुझे यह बहुत अच्छा लग रहा है...



  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. डबल-एन्कोडेड UTF8 वर्णों को कैसे ठीक करें (utf-8 तालिका में)

  2. तालिका को दो बार निर्दिष्ट किया गया है, दोनों 'अद्यतन' के लिए लक्ष्य के रूप में और mysql में डेटा के लिए एक अलग स्रोत के रूप में

  3. गतिरोध के बाद MySQL में लेनदेन को फिर से शुरू करना

  4. लिक्विबेस ग्रेडल प्लगइन से अंतर उत्पन्न करने में असमर्थ

  5. अधिसूचना के लिए हर सेकेंड क्वेरी तालिका। क्या यह एक अच्छा अभ्यास है?