साउंडेक्स ध्वनि द्वारा नामों को अनुक्रमित करने के लिए एक ध्वन्यात्मक एल्गोरिथ्म है, जैसा कि अंग्रेजी में उच्चारित किया गया है। इसे 1918 और 1922 में विकसित और पेटेंट कराया गया था।
SQL सर्वर में उपलब्ध कार्यों में से एक है SOUNDEX()
फ़ंक्शन, जो किसी दिए गए स्ट्रिंग के लिए साउंडेक्स कोड देता है।
सिंटैक्स
वाक्य रचना इस प्रकार है:
SOUNDEX ( character_expression )
जहां character_expression
वह शब्द या स्ट्रिंग है जिसके लिए आप साउंडएक्स कोड चाहते हैं। यह एक स्थिर, परिवर्तनशील या स्तंभ हो सकता है।
SOUNDEX()
फ़ंक्शन संयोजन संवेदनशील है, और स्ट्रिंग फ़ंक्शन को नेस्ट किया जा सकता है।
द साउंडेक्स कोड
जैसा कि बताया गया है, SOUNDEX()
फ़ंक्शन दिए गए स्ट्रिंग के लिए साउंडएक्स कोड देता है। साउंडेक्स कोड चार वर्णों वाला कोड होता है जो इस पर आधारित होता है कि बोली जाने पर स्ट्रिंग कैसी लगती है। साउंडेक्स कोड का एक उदाहरण यहां दिया गया है:
S600
यहां बताया गया है कि साउंडेक्स कोड कैसे बनाया जाता है:
- कोड का पहला अक्षर स्ट्रिंग का पहला अक्षर है, जिसे अपर केस में बदल दिया गया है। तो उपरोक्त उदाहरण में, हम जानते हैं कि स्ट्रिंग एस अक्षर से शुरू होती है (या तो लोअरकेस या अपरकेस)।
- कोड के दूसरे से चौथे वर्ण वे संख्याएं हैं जो व्यंजक में अक्षरों का प्रतिनिधित्व करती हैं।
- अक्षर A, E, I, O, U, H, W, और Y को तब तक अनदेखा किया जाता है जब तक कि वे स्ट्रिंग के पहले अक्षर न हों।
- यदि चार वर्णों वाला कोड बनाने के लिए आवश्यक हो तो अंत में शून्य जोड़ दिए जाते हैं।
उदाहरण
यहाँ एक स्ट्रिंग से साउंडेक्स स्ट्रिंग को पुनः प्राप्त करने का एक उदाहरण दिया गया है:
SELECT SOUNDEX('Sure');
परिणाम:
S600
तो हम देख सकते हैं कि शब्द Sure
इसका साउंडेक्स कोड S600
. है ।
दो मिलान करने वाले शब्दों का उदाहरण
यहां एक उदाहरण दिया गया है जहां दो शब्द समान साउंडेक्स कोड साझा करते हैं (क्योंकि वे एक जैसे लगते हैं):
SELECT SOUNDEX('Sure') AS Sure, SOUNDEX('Shore') AS Shore;
परिणाम:
Sure Shore ---- ----- S600 S600
यहां कुछ और सटीक मिलान उदाहरण दिए गए हैं:
SELECT SOUNDEX('Dam') AS Dam, SOUNDEX('Damn') AS Damn, SOUNDEX('Too') AS Too, SOUNDEX('Two') AS Two;
परिणाम:
Dam Damn Too Two ---- ---- ---- ---- D500 D500 T000 T000
उन शब्दों का उदाहरण जो मेल नहीं खाते हैं
यहां एक उदाहरण दिया गया है कि जहां दो शब्द एक जैसे नहीं लगते हैं, और इसलिए, उनके अलग-अलग साउंडेक्स कोड हैं:
SELECT SOUNDEX('Water') AS Water, SOUNDEX('Coffee') AS Coffee;
परिणाम:
Water Coffee ----- ------ W360 C100
विभिन्न वर्तनी वाले शब्द
आप किस देश से हैं, इसके आधार पर कुछ शब्दों की वर्तनी अलग-अलग होती है। ऐसे शब्द समान साउंडेक्स कोड साझा करेंगे:
SELECT SOUNDEX('Flavor') AS 'Flavor', SOUNDEX('Flavour') AS 'Flavour';
परिणाम:
Flavor Flavour ------ ------- F416 F416
समान ध्वनि, भिन्न ध्वनि कोड
कभी-कभी, दो शब्द एक जैसे लगते हैं, लेकिन उनके साउंडेक्स कोड भिन्न होते हैं। इसका सबसे आम कारण यह है कि वे एक अलग अक्षर से शुरू होते हैं (एक मूक पत्र का उपयोग करता है)। जैसा कि उल्लेख किया गया है, साउंडएक्स कोड स्ट्रिंग के पहले अक्षर से शुरू होता है (अपरकेस में परिवर्तित)। इसलिए, यदि आपके पास दो शब्द हैं जो बिल्कुल समान हैं, लेकिन वे एक अलग अक्षर से शुरू होते हैं, तो उनके पास एक अलग साउंडेक्स कोड होगा।
यहां कुछ उदाहरण दिए गए हैं:
SELECT SOUNDEX('Hole') AS 'Hole', SOUNDEX('Whole') AS 'Whole', SOUNDEX('Our') AS Our, SOUNDEX('Hour') AS Hour;
परिणाम:
Hole Whole Our Hour ---- ----- ---- ---- H400 W400 O600 H600
इस उदाहरण में जोड़े के अलग-अलग साउंडेक्स कोड हैं क्योंकि उनका पहला अक्षर अलग है।