代码:错误使用海葵
require 'anemone'
Anemone.crawl("http://www.example.com/") do |anemone|
anemone.on_every_page do |page|
puts page.url
end
end
当我尝试这个代码,我应该得到该网站上所有的URL列表,但我得到的是只是名字网站。什么可能是错误,我如何得到所有网址列表?
代码:错误使用海葵
require 'anemone'
Anemone.crawl("http://www.example.com/") do |anemone|
anemone.on_every_page do |page|
puts page.url
end
end
当我尝试这个代码,我应该得到该网站上所有的URL列表,但我得到的是只是名字网站。什么可能是错误,我如何得到所有网址列表?
我猜anemone不能跟随重定向或类似的东西,导致“http://example.com”在其他网站上重定向我。您是否尝试过抓取其他网站?例如,http://stackoverflow.com。
它工作正常。很明显,如果你在example.com上这样做,它只会显示http://www.example.com,因为只有这个页面。 – thoferon