2010-02-17 46 views
3

我一直在开发Java程序,通过使用各种HTML解析器像耶利哥,NekoHtml等解析网页的HTML源代码HTML解析器的PHP像Java

现在我想开发PHP语言解析器。因此,在开始之前,我想知道是否有任何可用的PHP解析器,我可以使用PHP来解析HTML代码

回答

2

结账DOMDocument

示例#1创建文档

<?php 
$doc = new DOMDocument(); 
$doc->loadHTML("<html><body>Test<br></body></html>"); 
echo $doc->saveHTML(); 
1

DOM就是这个不错。它也可以处理无效的标记,但是,如果标记不完善,它会抛出未记录的错误和异常,所以我建议您在将HTML加载到DOM之前使用HTMLPurifier或其他库过滤HTML。

+0

对于“使用HTMLPurifier或某些过滤HTML ...” –