मेरा सुझाव है कि आपको PHP की DOM लाइब्रेरी का उपयोग करना चाहिए। . यह बहुत शक्तिशाली है और किसी भी DOM संरचना को पार्स करने की अनुमति देता है। इसके कुछ उदाहरण देखें और आप इसे आसानी से लागू कर सकते हैं।
विचार यह है कि आप Google द्वारा लौटाए गए पृष्ठ की HTML संरचना का अध्ययन करते हैं और तदनुसार विशिष्ट टैग को पार्स करने के लिए DOM लाइब्रेरी का उपयोग करते हैं। मैं जो देखता हूं, छवियों को <ul>
. के रूप में व्यवस्थित किया जाता है और <li>
टैग, जैसे:
<ul class="rg_ul" data-pg="1" data-cnt="6">
<li class="rg_li" data-row="1" style="width:216px;height:162px"></li>
<li class="rg_li" style="width:231px;height:162px"></li>
<li class="rg_li" style="width:218px;height:162px"></li>
<li class="rg_li" style="width:216px;height:162px"></li>
<li class="rg_li" style="width:216px;height:162px"></li>
<li class="rg_li" style="width:217px;height:162px"></li>
</ul>
हर <li>
. के अंदर टैग में अतिरिक्त टैग होते हैं, जिनमें से एक है <a>
. ऐसा लगता है कि इस टैग में 2 विशेषताएँ हैं - "imgrefurl" और "imgurl" - जो आपको वह छवि दे सकती हैं जिसकी आपको आवश्यकता है। आपको इन 2 विशेषताओं में से कौन-सी खोज करने की आवश्यकता है।
वैकल्पिक रूप से, एक <img>
. है <li>
. के अंदर टैग करें जिसमें वास्तविक छवि बाइनरी युक्त "src" विशेषता है। तो आप इसे पार्स भी कर सकते हैं। कृपया ध्यान दें कि बाइनरी उस छवि के लिए है जिसे आप खोज पृष्ठ पर देखते हैं न कि वास्तविक छवि के लिए।
DOM के कुछ पॉइंटर्स के लिए, यह विधि उपयोगी हो सकती है - http://www .php.net/manual/hi/domelement.getelementsbytagname.php
और http://www.php.net/manual/en/domelement। hasattribute.php
- सभी <li>
read पढ़ने के लिए टैग और फिर "rg_li" वर्ग का उपयोग करने वालों के लिए पार्स करें।
मुझे आशा है कि उपरोक्त समझ में आता है