2008-08-26 65 views
9

我要寻找一个在PHP操作HTML的好方法。例如,我目前遇到的问题是处理格式不正确的html。DOM操作在PHP

我越来越投入,看起来是这样的:

<div>This is some <b>text 

当你注意到了,HTML是缺少结束标记。我可以使用正则表达式或XML解析器来解决这个问题。不过,我很可能在将来不得不做其他DOM操作。我不知道是否有是处理类似与DOM操作如何交易的Javascript DOM操作任何好的PHP库。

+0

我会做别的事情与前通过HTML净化器运行不良HTML。 – TRiG 2010-11-02 15:15:38

回答

1

用于操作DOM我认为你要寻找的是this。我曾经从网上解析HTML文件,它对我来说工作得很好。

3

DOM库的链接。 loadHTML方法将接受格式不正确的XML,而加载方法则不会。

$d = new DOMDocument; 
$d->loadHTML('<div>This is some <b>text'); 
$d->saveHTML(); 

输出将是:

<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN" "http://www.w3.org/TR/REC-html40/loose.dtd"> 
<html> 
    <body> 
    <div>This is some <b>text</b></div> 
    </body> 
</html>