红宝石机械化与http身份验证问题

我有问题解决使用http身份验证的网站，我有一个网站的列表，我做了一些报废，但其中一些有他们的HTTP身份验证。我不希望获得那些我希望能够确定它们是否被http auth守护并继续前进的网站的内容。例如，在代理下面的代码片段中，永远不会返回，因此我无法处理它。我该如何处理这种情况？红宝石机械化与http身份验证问题

require 'mechanize' 
agent = Mechanize.new 
page = agent.get('http://freyalovesmusic.co.uk')

来源

2012-10-29 Luis D Urraca

您可以假设，如果页面加载时间过长，则使用http身份验证。显然不是100％准确，但也许足够你的情况？

可以使用超时模块一定时间后继续前进，即使agent.get永远不会返回：

require 'mechanize' 
require 'timeout' 

agent = Mechanize.new 
begin 
    Timeout::timeout(5) do 
     page = agent.get('http://freyalovesmusic.co.uk') 
    end 
rescue Timeout::Error 
    puts 'Page likely using http authentication' 
end

来源

2012-10-29 20:28:28

哇真棒......这是什么结束了，实际上是在这里阅读之前做的。验证我的想法。 –

应该养Mechanize::UnauthorizedError但它的行为不端的某些原因。也许你应该在机械化github问题表单上报告它。

来源

2012-10-30 00:56:59 pguardiario

我会报告它。 –

红宝石机械化与http身份验证问题

回答

相关问题