2010-10-08 37 views
0

我已尽全力通过研究来自己回答这个问题,但我仍然有点担心我是否使用正确的东西。 基本上我正在使用DomDocument库为我的框架构建一个类似jQuery的主题解析器。现在,网络就像今天一样HTML的形式和大小不同,例如HTML 4,HTML 5,XHTML,XHTML 5等...... 我用DomDocument发现的问题是如果你给它HTML代码,它会只有符合标准的XHTML才能使用它。 我知道它可以将它转换为XHTML,我可以使用整洁的库来使代码可以接受,但是我主要担心的是:如果使用我的框架的开发人员使用所有酷(有争议的)新HTML 5功能的主题,只要他把它传递给我的框架,它就会引发发脾气或将其转换为XHTML,这将吸引。我是否应该使用DomDocument解析HTML代码

所以我的问题是: DomDocument是我需要的最方便的库吗?

有没有得到它与HTML的所有变种的不同的工作方式?

回答

1

DOMDocument可以解析非XHTML文件。只需设置适当的开关:

libxml_use_internal_errors (true); 

    $dom = new DOMDocument; 
    $dom -> formatOutput = true; 
    $dom -> substituteEntities = false; 
    $dom -> recover = true; 
    $dom -> strictErrorChecking = false; 
+0

嗯,我给一个尝试 – 2010-10-08 07:35:10