我不得不处理在HTML里面不良HTML和HTML标签属性:这不适合Html解析器吗?
<p class="<sometag attr="something"></sometag>">
<a href="<someothertag></someothertag">Link</a>
</p>
我试着用HtmlAgilityPack解析出的内容,但是当你在上面的代码加载到的HTMLDocument,则OuterHtml
输出:
<p class="<sometag attr=" something"="">">
<a href="<someothertag></someothertag">Link</a>
</p>
的p
标签格式错误,进而a
标签的href
属性里面的someothertag
不被识别为一个节点(虽然它是真正的文本属性里面,我想它是RECO gnized作为标签)。
有什么我可以用来帮助我解析这样的坏Html吗?
恐怕你不能真的解析这样的事情。至少不是以你想要的方式工作的方式。为什么你需要解析这样可怕的事情? – svick
我甚至想知道谁/会产生这样的事情吗? – ChaosPandion
这是一个我需要处理的自定义模板语法。 – Omar