查看Nokogiri的教程。特别是,你想读"Modifying an HTML/XML Document", Changing text contents。
Nokogiri的XML访问器非常友好,因为您不需要使用XPath。你也可以使用CSS访问器,对于那些不是XML的人来说,他们可以帮助很多。
在该特定示例中,他们使用at_css
方法,该方法搜索目标的第一个匹配项。您有许多替代方法,它们是同义词:at
,%
,at_css
和at_xpath
处理“找到第一个”的情况。 search
,css
,xpath
, /
类似地处理“查找所有事件”。
例如:
require 'nokogiri'
html = '<h1>Snap, Crackle and Pop</h1>'
doc = Nokogiri::HTML(html)
h1 = doc.at('h1')
h1.content = h1.content[0, h1.content.length - 3] + '...'
puts doc.to_html
>> <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN" "http://www.w3.org/TR/REC-html40/loose.dtd">
>> <html><body><h1>Snap, Crackle and ...</h1></body></html>
这创造了一个引入nokogiri新的HTML文档,搜索第一H1,并修剪后的3个字符的内容,以省略号代替它们。
意思短语。对不起,拼写错误。 – Ariel 2011-03-10 21:28:40
你能否给出一些简单的实际输入和输出数据,这可以解释你想在这里实现什么东西? – Dogbert 2011-03-10 21:46:31
如果你需要帮助,请做Dogbert说的话。你的问题还不够清楚。 – Phrogz 2011-03-13 18:42:15