http://mirror.nyi.net से स्रोत प्राप्त करें /apache//nutch/apache-nutch-1.2-src.zip
ओपन org.apache.nutch.crawl.Crawl
अपने संपादक में कक्षा।
लुकअप वैरिएबल Path crawlDb = new Path(dir + "/crawldb");
अपना खुद का CustomMySQLCrawl
प्राप्त करने के लिए वेरिएबल इस बात का संकेत देगा कि कोड को कहां बदला जाए कक्षा।
इस कॉल के दौरान दृढ़ता हो रही है:crawlDbTool.update(crawlDb, segs, true, true); // update crawldb
तो वहाँ है जहाँ आपको इसे डेटाबेस में सहेजना चाहिए। आप इस बिंदु पर हाइबरनेट को एकीकृत करने पर विचार करना चाहेंगे।