साउंडेक्स ध्वनि द्वारा नामों को अनुक्रमित करने के लिए एक ध्वन्यात्मक एल्गोरिथ्म है, जैसा कि अंग्रेजी में उच्चारित किया गया है। इसे 1918 और 1922 में विकसित और पेटेंट कराया गया था।
SQL सर्वर में उपलब्ध कार्यों में से एक है SOUNDEX() फ़ंक्शन, जो किसी दिए गए स्ट्रिंग के लिए साउंडेक्स कोड देता है।
सिंटैक्स
वाक्य रचना इस प्रकार है:
SOUNDEX ( character_expression )
जहां character_expression वह शब्द या स्ट्रिंग है जिसके लिए आप साउंडएक्स कोड चाहते हैं। यह एक स्थिर, परिवर्तनशील या स्तंभ हो सकता है।
SOUNDEX() फ़ंक्शन संयोजन संवेदनशील है, और स्ट्रिंग फ़ंक्शन को नेस्ट किया जा सकता है।
द साउंडेक्स कोड
जैसा कि बताया गया है, SOUNDEX() फ़ंक्शन दिए गए स्ट्रिंग के लिए साउंडएक्स कोड देता है। साउंडेक्स कोड चार वर्णों वाला कोड होता है जो इस पर आधारित होता है कि बोली जाने पर स्ट्रिंग कैसी लगती है। साउंडेक्स कोड का एक उदाहरण यहां दिया गया है:
S600
यहां बताया गया है कि साउंडेक्स कोड कैसे बनाया जाता है:
- कोड का पहला अक्षर स्ट्रिंग का पहला अक्षर है, जिसे अपर केस में बदल दिया गया है। तो उपरोक्त उदाहरण में, हम जानते हैं कि स्ट्रिंग एस अक्षर से शुरू होती है (या तो लोअरकेस या अपरकेस)।
- कोड के दूसरे से चौथे वर्ण वे संख्याएं हैं जो व्यंजक में अक्षरों का प्रतिनिधित्व करती हैं।
- अक्षर A, E, I, O, U, H, W, और Y को तब तक अनदेखा किया जाता है जब तक कि वे स्ट्रिंग के पहले अक्षर न हों।
- यदि चार वर्णों वाला कोड बनाने के लिए आवश्यक हो तो अंत में शून्य जोड़ दिए जाते हैं।
उदाहरण
यहाँ एक स्ट्रिंग से साउंडेक्स स्ट्रिंग को पुनः प्राप्त करने का एक उदाहरण दिया गया है:
SELECT SOUNDEX('Sure'); परिणाम:
S600
तो हम देख सकते हैं कि शब्द Sure इसका साउंडेक्स कोड S600 . है ।
दो मिलान करने वाले शब्दों का उदाहरण
यहां एक उदाहरण दिया गया है जहां दो शब्द समान साउंडेक्स कोड साझा करते हैं (क्योंकि वे एक जैसे लगते हैं):
SELECT
SOUNDEX('Sure') AS Sure,
SOUNDEX('Shore') AS Shore; परिणाम:
Sure Shore ---- ----- S600 S600
यहां कुछ और सटीक मिलान उदाहरण दिए गए हैं:
SELECT
SOUNDEX('Dam') AS Dam,
SOUNDEX('Damn') AS Damn,
SOUNDEX('Too') AS Too,
SOUNDEX('Two') AS Two; परिणाम:
Dam Damn Too Two ---- ---- ---- ---- D500 D500 T000 T000
उन शब्दों का उदाहरण जो मेल नहीं खाते हैं
यहां एक उदाहरण दिया गया है कि जहां दो शब्द एक जैसे नहीं लगते हैं, और इसलिए, उनके अलग-अलग साउंडेक्स कोड हैं:
SELECT
SOUNDEX('Water') AS Water,
SOUNDEX('Coffee') AS Coffee; परिणाम:
Water Coffee ----- ------ W360 C100
विभिन्न वर्तनी वाले शब्द
आप किस देश से हैं, इसके आधार पर कुछ शब्दों की वर्तनी अलग-अलग होती है। ऐसे शब्द समान साउंडेक्स कोड साझा करेंगे:
SELECT
SOUNDEX('Flavor') AS 'Flavor',
SOUNDEX('Flavour') AS 'Flavour'; परिणाम:
Flavor Flavour ------ ------- F416 F416
समान ध्वनि, भिन्न ध्वनि कोड
कभी-कभी, दो शब्द एक जैसे लगते हैं, लेकिन उनके साउंडेक्स कोड भिन्न होते हैं। इसका सबसे आम कारण यह है कि वे एक अलग अक्षर से शुरू होते हैं (एक मूक पत्र का उपयोग करता है)। जैसा कि उल्लेख किया गया है, साउंडएक्स कोड स्ट्रिंग के पहले अक्षर से शुरू होता है (अपरकेस में परिवर्तित)। इसलिए, यदि आपके पास दो शब्द हैं जो बिल्कुल समान हैं, लेकिन वे एक अलग अक्षर से शुरू होते हैं, तो उनके पास एक अलग साउंडेक्स कोड होगा।
यहां कुछ उदाहरण दिए गए हैं:
SELECT
SOUNDEX('Hole') AS 'Hole',
SOUNDEX('Whole') AS 'Whole',
SOUNDEX('Our') AS Our,
SOUNDEX('Hour') AS Hour; परिणाम:
Hole Whole Our Hour ---- ----- ---- ---- H400 W400 O600 H600
इस उदाहरण में जोड़े के अलग-अलग साउंडेक्स कोड हैं क्योंकि उनका पहला अक्षर अलग है।