2011-12-19 115 views
1

可能重复:
Recommend a HTML Validator in java
How to validate HTML from Java?确定一个字符串是否是有效的HTML代码

我如何将能够检查是否存在串所代表有效的HTML代码? (能够在HTML代码之前和之后留出空格)

例如,字符串<html><body><h1>My First Heading</h1><p>My first paragraph.</p></body></html>将返回true,因为它是有效的HTML。

但是,以下字符串<html><body><h1>p>My first paragraph.</p></body></html>将返回false,因为它不是有效的HTML。

+3

使用HTML解析器! – fge 2011-12-19 20:51:12

+0

我相信这是非常类似的问题,很好的答案http://stackoverflow.com/questions/4217801/recommend-a-html-validator-in-java – 2011-12-19 20:52:17

+0

最终,这几乎是不可能的,因为你可以得到像哪个引擎一样详细会呈现这一点,哪些不会。如果你愿意,你可以验证vs正则表达式。你也可以检查它是否是有效的XML ......但是HTML!= XML,不幸的是有坏的网站可以很好的呈现,但不是有效的XML。 http://www.regular-expressions.info/examples.html – SQLMason 2011-12-19 20:54:08

回答

0

最好使用HTML解析,也许JTidy会非常适合。

相关问题