वर्डनेट एक सुपर कूल वर्ड डेटाबेस है। मैं खुद इस पर शोध कर रहा हूं। मैं अपने निष्कर्षों को नीचे सूचीबद्ध करूंगा - और उम्मीद है कि इससे आपको तालिकाओं को बेहतर ढंग से समझने में मदद मिलेगी।
सिंसेट टेबल सिंकसेट तालिका डेटाबेस में सबसे महत्वपूर्ण तालिकाओं में से एक है। यह वर्डनेट के भीतर सभी परिभाषाओं को रखने के लिए जिम्मेदार है। सिनसेट टेबल की प्रत्येक पंक्ति में एक सिनसेटिड, एक परिभाषा, एक पॉज़ (भाषण क्षेत्र के हिस्से) और एक लेक्सडोमेनिड (जो लेक्सडोमेन टेबल से लिंक होता है) वर्डनेट डेटाबेस में 117373 सिंक होते हैं।
शब्द तालिका वर्डनेट में एक "शब्द" तालिका भी होती है, जिसमें केवल दो फ़ील्ड होते हैं:एक वर्डिड, और एक "लेम्मा"। वर्डनेट डेटाबेस के भीतर सभी लेम्मा (आधार शब्द) को रखने के लिए शब्द तालिका जिम्मेदार है। इस तालिका में 146625 प्रविष्टियां हैं
तो .. ये दो टेबल कैसे जुड़े हुए हैं? उत्तर? सेंस टेबल!
द सेंस टेबल सेंस टेबल शब्दों (शब्द तालिका में) को परिभाषाओं के साथ जोड़ने के लिए जिम्मेदार है (सिंसेट टेबल में)। अर्थ तालिका में प्रविष्टियों को "शब्द-भावना जोड़े" के रूप में संदर्भित किया जाता है - क्योंकि एक सिंसेट के साथ एक वर्डिड की प्रत्येक जोड़ी एक शब्द का एक पूर्ण अर्थ है - एक "शब्द की भावना"।
वर्डनेट डेटाबेस में कुल 206,354 शब्द इंद्रियां हैं।
लेक्सडोमेन तालिका Lexdomains तालिका को अर्थ तालिका द्वारा संदर्भित किया जाता है, और इसका उपयोग यह परिभाषित करने के लिए किया जाता है कि शब्द-अर्थ जोड़ी किस लेक्सिकल डोमेन से संबंधित है। लेक्सडोमेन टेबल में 45 लेक्सिकल डोमेन हैं। इसलिए लेक्सडोमेन टेबल, वर्डनेट का वर्ड-सेंस पेयर "टैगिंग" करने का तरीका है। हालाँकि, यह काफी सीमित है, क्योंकि एक शब्द-बोध जोड़ी केवल एक लेक्सिकल डोमेन से संबंधित हो सकती है।
45 शाब्दिक डोमेन में शामिल हैं:
विशेषण: सभी, पर्ट
क्रिया विशेषण सभी
संज्ञाएं सबसे ऊपर, कार्य, पशु, कलाकृति, विशेषता, शरीर, अनुभूति, संचार, घटना, भावना, भोजन, समूह, स्थान, मकसद, वस्तु, व्यक्ति, घटना, पौधे, अधिकार, प्रक्रिया, मात्रा, लिंकडेफ, आकार, राज्य, पदार्थ समय,
क्रियाएं शरीर, परिवर्तन, अनुभूति, संचार, प्रतिस्पर्धा, उपभोग, संपर्क, सृजन, भावना, गति, धारणा, अधिकार, सामाजिक, स्थिर, मौसम, पीपीएल
केसवर्ड्स तालिका शब्द तालिका के भीतर कुछ शब्दों में स्वाभाविक रूप से पहला अक्षर बड़ा होता है यानी:"ए-टीम"। चूंकि शब्द तालिका सभी शब्दों को लोअरकेस के रूप में संग्रहीत करती है, वर्डनेट शब्द के अपरकेस संस्करण को निर्दिष्ट करने के लिए इस तालिका का उपयोग करता है। इस तालिका में 40313 प्रविष्टियां हैं।
वर्डनेट डीबी में कई अन्य टेबल हैं, एक बार जब मैंने उन्हें शोध किया है, तो मैं फिर से पोस्ट करूंगा।
वर्ष के समानार्थी शब्द ढूँढना समानार्थक शब्द के संबंध में अपने प्रश्न का उत्तर देने के लिए - आपको निम्न कार्य करने होंगे।
मान लीजिए कि आप "कैरी" शब्द के लिए समानार्थी शब्द खोजना चाहते हैं। ऐसा करने के लिए, आप पहले शब्द तालिका में "कैरी" शब्द से मेल खाने वाले लेम्मा की खोज करेंगे। इससे वर्डिड 21253 प्राप्त होगा। फिर आप शब्द-संवेदी जोड़े को कैरी शब्द के लिए खोजने के लिए, इंद्रियों की तालिका को खोजेंगे। इससे 41 परिणाम मिलते हैं - प्रत्येक परिणाम में वर्डिड 21253, और एक सेंसिड (जो शब्द-बोध जोड़ी का सूचकांक है) और एक सिनसेटिड सूचीबद्ध होता है।
अब, आपको प्रत्येक सिनसेटिड की वापसी के लिए सिनसेट तालिका को क्वेरी करने की आवश्यकता होगी ताकि आप सिनसेट तालिका में संबंधित परिभाषा फ़ील्ड तक पहुंच सकें।
अंत में सूचीबद्ध प्रत्येक सिनसेट के लिए समानार्थक शब्द खोजने के लिए, आपको बस अन्य शब्द-संवेदी युग्मों के लिए अर्थ तालिका खोजने की आवश्यकता होगी जो समान सिनसेट साझा करते हैं।
उदाहरण:"कैरी" शब्द के लिए 41 शब्द-अर्थ जोड़े में से एक नीचे सूचीबद्ध है:अगर हम इस सिनसेटिड 202083512 की परिभाषा देखें, तो आप पाएंगे कि "ट्रांसमिट या ट्रांसमिशन के लिए माध्यम के रूप में काम करता है"
इस परिभाषा के लिए सभी समानार्थक शब्द खोजने के लिए, आप उसी सिनसेटिड 202083512 के लिए अर्थ तालिका खोजेंगे। यह समानार्थक शब्द उत्पन्न करता है:चैनल, आचरण, संदेश, प्रदान, और संचारित (नोट:आपको प्राप्त करने के लिए शब्द तालिका में शामिल होने की आवश्यकता होगी वास्तविक नींबू)
मुझे आशा है कि यह आपके लिए वर्डनेट को रहस्यमय बनाने में मदद करेगा.. मुझे यह बहुत अच्छा लग रहा है...