我有一个包含一个HTML文档数据:解析HTML(不遵循HTML语义)使用引入nokogiri
<div>
<p class="someclass">
<ul>
<li>Item 1</li>
<li>Item 2</li>
</ul>
</p>
</div>
在解析使用:
div_node.children.each do |child|
if child.node_name == 'p'
#store it as html string in db
store(child.to_html)
end
end
当我检查数据库,我只得到外<p>
标签:
<p class="someclass">
</p>
没有内<ul>
标签内容被存储或保留rieved。
我知道<p>
标签不能包含<ul>
标签,但我们从客户得到的文档中有数据,有大约1000个文档与数据,所以我不能编辑手动
@Pete再次将p标签转换为div我将不得不使用nokogiri那里将不会有任何内容g节点,转换后的div标签也是如此。 想法? – ashishmohite