ruby
  • screen-scraping
  • nokogiri
  • mechanize
  • 2011-06-09 52 views 3 likes 
    3

    我是相当新的使用机械化,甚至红宝石一般。我正在使用它来浏览HTML格式不正确的网站。特别是,我有一个页面,其中有一个窗体以外的复选框(尽管这样,服务器会理性地处理这些请求)。解析HTML格式不正确使用Ruby机械化

    我想检查这些框,然后点击提交按钮(也形式外)。但是,我不能使用Form.checkbox_with,因为我没有一个Form对象,我只有Page。我可以找到与page.search("//input[@name='silly-checkbox']")页面上的复选框,但据我了解,我不能检查它之后(因为Nokogiri只用于刮,并没有跟踪状态)。请让我知道,如果这是不正确的。

    底线:当我的复选框不在表单中时,如何获得Mechanize::Form::Checkbox对象?

    回答

    0

    你可以使用普通的旧引入nokogiri手动加载远程页面,然后修复标记(即发现外形式复选框和包裹它们),并从固定HTML代码自己构造机械化类。

    0

    您可以通过删除和合并新字段修改您的形式。

    form.add_field!('gender', 'male') 
    

    rdoc here

    相关问题