0
我使用nokogiri来取消一个html页面,我是新来的,像我在创建任务时一样。我发现了一些教程,我认为我可以根据自己的需要对其进行修改,但是我无法使其发挥作用。使用rake任务和ruby代码创建记录html
这里是我使用到报废的HTML Ruby代码,当我在Ruby控制台运行它的作品不错,但现在我需要创建一个新的纪录,这一切领域:
require 'rubygems'
require 'mechanize'
#require 'pp'
a = Mechanize.new { |agent|
agent.user_agent_alias = 'Mac Safari'
}
a.get('http://ted.europa.eu/udl?uri=TED:NOTICE:143331-2012:DATA:EN:HTML&tabId=3') do |page|
title = page.search('table').search('tr')[0].search('td').map{ |n| n.text }
doc_nr = page.search('table').search('tr')[1].search('td').map{ |n| n.text }
pub_date = page.search('table').search('tr')[2].search('td').map{ |n| n.text }
puts "#{title} - #{doc_nr} - #{pub_date}"
end
会很高兴能得到一个完整的答案,但..一些好的教程和wiki链接也可以。非常感谢您的宝贵时间。
如何得到这个rake任务的任何想法? – rmagnum2002
是的,你只是把它放在任务的内部:scrape do ... end – pguardiario
谢谢你的回答。 – rmagnum2002