2012-10-27 53 views
0

我开发JSP的搜索引擎,我想用来解析HTML页面它的链接,并在其中寻找一些词 感谢HTML或XML解析器使用JSP

+0

你的问题是什么? –

+0

不要在JSP中编写任何逻辑。这些仅用于观点。 –

+0

我该如何解析HTML标题和正文来获取我搜索的文字 –

回答

0

分析HTML(仅XHTML)或XML就可以使用xslt处理器(Saxon,MSxsl)。您可以使用xsl样式表生成另一个xml,html或文本文件。

+0

你可以发给我教程 谢谢你很多 –

+0

[saxonica](http:// www。 saxonica.com)在这里你可以阅读关于撒克逊。有Java平台和.NET平台的安装。尝试xslt在线[w3schools](http://www.w3schools.com/xsl/tryxslt.asp?xmlfile=cdcatalog&xsltfile=cdcatalog) –

0

你应该考虑使用TagSoup或类似的东西。不要使用XML解析器。不能保证每个网页都符合XML标准。