我一直在开发Java程序,通过使用各种HTML解析器像耶利哥,NekoHtml等解析网页的HTML源代码HTML解析器的PHP像Java
现在我想开发PHP语言解析器。因此,在开始之前,我想知道是否有任何可用的PHP解析器,我可以使用PHP来解析HTML代码
我一直在开发Java程序,通过使用各种HTML解析器像耶利哥,NekoHtml等解析网页的HTML源代码HTML解析器的PHP像Java
现在我想开发PHP语言解析器。因此,在开始之前,我想知道是否有任何可用的PHP解析器,我可以使用PHP来解析HTML代码
结账DOMDocument。
示例#1创建文档
<?php
$doc = new DOMDocument();
$doc->loadHTML("<html><body>Test<br></body></html>");
echo $doc->saveHTML();
内建类DOM parser做得非常好。还有很多其他xml parsers。
DOM就是这个不错。它也可以处理无效的标记,但是,如果标记不完善,它会抛出未记录的错误和异常,所以我建议您在将HTML加载到DOM之前使用HTMLPurifier或其他库过滤HTML。
对于“使用HTMLPurifier或某些过滤HTML ...” –