2011-01-28 59 views
5

我需要html解析,它能够识别生成的html中的错误,并且如果标记未关闭,请关闭它并返回有效的html。HTML解析器验证标记

更多详细信息:我从数据库获取数据并打破该记录以显示我的网站上的部分详细信息,以便点击更多按钮,然后显示完整内容。打破字符串然后验证。

我已经使用Html敏捷包,但我是新来使用它,如果这个库解决了我的问题,然后指导我如何(教程)或建议我另一个库。

回答

1

这里有一对夫妇从万维网联盟的验证程序,在W3C的:

的Windows:http://validator.w3.org/docs/install_win.html

UNIX/Linux的:http://validator.w3.org/docs/install.html

您还可以使用自己的Web服务来验证您的CSS,HTML,XML,XHTML,JavaScript和许多其他网络技术。 W3C是保持互联网高度互操作性和互联网设备相互兼容的监管机构之一。

+0

读的问题再次,我已经添加了更多的细节,以便更好地理解 – Xulfee 2011-01-28 12:44:49

1

我不认为这样的图书馆确实存在。问题是,有些库确实可以识别HTML中的错误,但他们无法为你修复它们。

我认为使用W3C validator作为服务是最好的出发点。有一个开源库,它使用W3C验证程序的API来验证文档,如果它有效或不符合错误和警告,则会向您提供响应。我会从这开始,然后从那里继续。