2
使用Nutch,我想抓取所有http://www.amazon.com/网页,其ipod在他们的网址。nutch:用关键词搜索
对于e.g如果我在他们的搜索框进行搜索的ipod,我得到
http://www.amazon.com/s/ref=nb_sb_noss?url=search-alias%3Daps&field-keywords=ipod&x=0&y=0
本网页显示一堆的iPod链接。我想抓取每个与ipod相关的链接并获取它。
下的搜索结果中显示的第一个环节是
我应该低于使用?
+^http://([a-z0-9\-A-Z]*\.)*www.amazon.com/*ipod*
您可以添加一些链接,在这里给出更多的信息。 – Narendra