2009-10-03 19 views
0

使用引入nokogiri,把每个文本都通过html标签包围成一个数组?

doc = Nokogiri::HTML(your_html) 
doc.xpath("//text()").to_s 

这样做的工作,但是,它把一切都变成一个纯文本。

我需要通过HTML标签

<b> text</b> 
<h1>text3</b> 

包围的文本,并把它们放到数组。 [“text”,“text3”]

推荐的操作是什么?

我想这样做

doc.xpath( “*”)。文字

的,但不知道如何通过这一切迭代。

+0

你最好保持在同样的旧问题,并添加了评论。 – khelll

+0

你好,我知道但它不会把我当作原始提问者。 – KJW

回答

2
doc = Nokogiri::HTML(your_html) 
doc.xpath("//text()").to_a 
+0

哇这个作品真的很好!它甚至可以处理由
标签分隔的东西 – KJW

相关问题