对不起,关于最后一篇文章。使用XSLT在html中选择特定标记并将标记的内容打印到XML
现在我试着更加清楚。
我需要从一个HTML选择一些标签和我有以下XSLT
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output omit-xml-declaration="yes" indent="yes"/>
<xsl:strip-space elements="*"/>
<xsl:template match="node()|@*">
<xsl:copy>
<xsl:apply-templates select="node()|@*"/>
</xsl:copy>
</xsl:template>
<xsl:template match="a"><xsl:apply-templates/></xsl:template>
<xsl:template match="img"/>
</xsl:stylesheet>
这根据我的理解选择从一个HTML网页/文件<a>
和<img>
标签和打印标签里面的内容(告诉我,如果我的理解是错误的)。但上面的XSLT输出一个页面的整个html。任何人都可以指出我哪里可能出错,需要做些什么才能使它正确。
谢谢。
除非是HTML已知的一个非常具体的形式,不能使用对HTML XSLT作为XHTML。如果没有,则没有XML解析器会处理它。您可以调查JSoup,它可以从HTML生成XML DOM。 –