首先,这里是样品HTML表格: 提取数据与机械化
<tr> <td><strong>Kangchenjunga </strong></td> <td>8,586m<br /></td> <td>28,169ft</td> <td><div align="center">Nepal/India </div></td> <td>1955; G. Band, J. Brown </td> </tr>
的ARGV [0]将具有山名(第一colomn)并且返回值应该是最后一列,即第一次爬山的人。
所以我需要检查整行第一列是否是ARGV [0],如果是,那么我应该返回没有日期的最后一列。
require 'mechanize'
p=Mechanize.new.get('www.alpineascents.com/8000m-peaks.asp').body
if p.include?('<strong>'+ARGV[0])
puts 'ok'
end
我得到以下内容,如果我在html文档的主体中有ARGV [0],就会打印“ok”。 如何搜索同一行中发现ARGV [0]的最后一列?
例:
<tr>
<td><strong>GIVE THIS AS A PARAMETER </strong></td>
<td>SKIP THIS<br /></td>
<td>SKIP THIS</td>
<td><div align="center">SKIP THIS</div></td>
<td>I WANT IT TO RETURN THIS</td>
</tr>
我真的很新的红宝石
你看创业板引入nokogiri解析您的HTML(http://nokogiri.org/)? –
是的,但我真的不知道如何使用它。 我不知道如何设置搜索条件,获取html表中的行 – Laureant
我会为您发布一个机械化解决方案。它在内部使用nokogiri来解析HTML。它确实提供了一些你不会用nokogiri得到的好方便。我是一个热爱机械化的人,并且会在短时间内把你搞砸。 –