需要HTML敏捷软件包的一些帮助!使用Html Agility Pack从HTML BODY节点提取内部文本
基本上我想抓住纯文本与HTML的身体节点。 到目前为止,我已经在vb.net中尝试过这种方式,并且它无法返回内部文本的含义 没有看到任何变化,从我所能看到的情况看,至少是最少的。
Dim htmldoc As HtmlDocument = New HtmlDocument
htmldoc.LoadHtml(html)
Dim paragraph As HtmlNodeCollection = htmldoc.DocumentNode.SelectNodes("//body")
If Not htmldoc Is Nothing Then
For Each node In paragraph
node.ParentNode.RemoveChild(node, True)
Next
End If
Return htmldoc.DocumentNode.WriteContentTo
我已经试过这样:
Return htmldoc.DocumentNode.InnerText
但仍然没有运气!
任何建议???
[抓住所有从使用HTML敏捷性包HTML文本(可能重复http://stackoverflow.com/questions/4182594/grab-all-text-from-html-用-html-agility-pack) – richard