2012-05-07 26 views
0

我使用nokogiri来取消一个html页面,我是新来的,像我在创建任务时一样。我发现了一些教程,我认为我可以根据自己的需要对其进行修改,但是我无法使其发挥作用。使用rake任务和ruby代码创建记录html

这里是我使用到报废的HTML Ruby代码,当我在Ruby控制台运行它的作品不错,但现在我需要创建一个新的纪录,这一切领域:

require 'rubygems' 
require 'mechanize' 
#require 'pp' 

a = Mechanize.new { |agent| 
    agent.user_agent_alias = 'Mac Safari' 
} 

a.get('http://ted.europa.eu/udl?uri=TED:NOTICE:143331-2012:DATA:EN:HTML&tabId=3') do |page| 
    title    = page.search('table').search('tr')[0].search('td').map{ |n| n.text } 
    doc_nr   = page.search('table').search('tr')[1].search('td').map{ |n| n.text } 
    pub_date   = page.search('table').search('tr')[2].search('td').map{ |n| n.text } 

    puts "#{title} - #{doc_nr} - #{pub_date}" 
end 

会很高兴能得到一个完整的答案,但..一些好的教程和wiki链接也可以。非常感谢您的宝贵时间。

回答

1

ActiveRecord的:

Record.new(:title => title, :doc_nr => doc_nr, :pub_date => pub_date).save 
+0

如何得到这个rake任务的任何想法? – rmagnum2002

+0

是的,你只是把它放在任务的内部:scrape do ... end – pguardiario

+0

谢谢你的回答。 – rmagnum2002