2014-03-02 38 views
0

我正在尝试构建一个简单的爬网程序,它可以登录Pinterest并将一些东西粘贴到我的主板上。使用红宝石机械化登录到Pinterest时出现问题

这是成功登录的第一步。我通过文档阅读,似乎这应该工作,但事实并非如此。

当我跑我希望它打印出来像一个标题代码“玛丽......玛丽...... Pinterest上”

但不是页面的标题是“Pinterest的,可视化搜索工具“

我认为我的脚本有问题。

require 'rubygems'                 
require 'mechanize'                 
require 'pry'                  

a = Mechanize.new                 
a.get('https://www.pinterest.com/login/') do |page|         
    form = page.forms.first               
    form.fields[0].value = "[email protected]"         
    form.fields[1].value = "some_password"           
    new_page = form.submit               
    puts new_page.title                
end 

回答

0

请记住,mechanize没有执行javascript的能力,如果页面依赖于javascript,它可能无法正确加载。尽管我只对源代码进行了轻读,但看起来它非常依赖于javascript,因此无法通过机械化有效地抓取。

另一种选择可能是使用像watirselenium这样的无头浏览器。