यहां से स्टॉप वर्ड्स (गैर-कीवर्ड) की एक सूची प्राप्त करें, आदमी ने उन्हें आपके लिए php में भी फॉर्मेट किया है।http://armandbrahaj.blog.al/2009/04/14/list-of-english-stop-words/
फिर जिस स्ट्रिंग को आप अनुक्रमित कर रहे हैं उस पर बस एक preg_replace करें।
मैंने अतीत में जो किया है वह रेगेक्स के साथ 'एस', 'एड' इत्यादि जैसे प्रत्यय हटा देता है और खोज स्ट्रिंग पर उसी रेगेक्स का उपयोग करता है। हालांकि यह आदर्श नहीं है। यह केवल 200 पृष्ठों वाली एक मूल वेबसाइट के लिए था।
यदि आप प्रदर्शन के बारे में चिंतित हैं तो आप डेटाबेस के बजाय ल्यूसीन (सोलर) जैसे खोज इंजन का उपयोग करने पर विचार कर सकते हैं। यह अनुक्रमण को बहुत आसान बना देगा। आप यहां पहिए को फिर से नहीं बनाना चाहते हैं।