我知道如何通过cUrl获取html源代码,但是我想删除html文档中的注释(我的意思是<!-- .. -->
之间的内容)。另外,如果我可以只取html文档的BODY
。谢谢。从html源代码中删除评论
9
A
回答
25
尝试PHP DOM*:
$html = '<html><body><!--a comment--><div>some content</div></body></html>'; // put your cURL result here
$dom = new DOMDocument;
$dom->loadHtml($html);
$xpath = new DOMXPath($dom);
foreach ($xpath->query('//comment()') as $comment) {
$comment->parentNode->removeChild($comment);
}
$body = $xpath->query('//body')->item(0);
$newHtml = $body instanceof DOMNode ? $dom->saveXml($body) : 'something failed';
var_dump($newHtml);
输出:
string(36) "<body><div>some content</div></body>"
+0
看起来它运行良好,我从来没有听说过DOM。谢谢。 – Luis 2011-06-10 12:06:47
1
0
我会管它的sed的正则表达式,像
curl http://yoururl.com/test.html | sed -i "s/<!\-\-\s?\w+\s?\-\->//g" | sed "s/.?(<body>.?</body>).?/\1/"
的正则表达式可能不准确,但你的想法...
相关问题
- 1. 从html中删除角度评论
- 2. 从评论框(Facebook评论插件)中删除评论
- 3. WordPress的 - 评论html代码
- 4. REGEX:如何使用PHP代码从javascripts中删除评论
- 5. 如何从代码中删除C风格的评论
- 6. 代码从WP标题中删除插件评论
- 7. 自动从PHP代码中删除评论的最佳方式
- 8. 评论代码或不评论代码
- 9. 删除评论
- 10. 删除评论
- 11. 从inner_html删除评论
- 12. 在评论框中处理html代码
- 13. 如何从SQLite中的数据源中删除所有评论?
- 14. PHP删除所有的HTML,但评论
- 15. 使用sed删除html评论标签
- 16. 删除Facebook评论
- 17. CsQuery删除评论
- 18. 删除评论【JAVA]
- 19. 从C#中的字符串中删除HTML标签和评论?
- 20. 评论董事会删除评论
- 21. 删除评论中的.csv
- 22. 从源文件中删除关键字替换评论?
- 23. SQLite:从文本正文中删除HTML评论
- 24. 使用Maven从HTML模板中删除评论
- 25. Istanbul.js - 从源代码中删除装饰
- 26. 带评论的JavaScript代码的HTML
- 27. PHP代码只是评论我的html
- 28. 已移至代码评论评论
- 29. 从magento的评论(评论)部分删除日期
- 30. 如何删除评论和评论从这个哈希计数
你应该手动解析它们......我有我自己的JavaScript库,但我不知道你怎么能在PHP – metaforce 2011-06-10 11:24:44
中实现它,这里没有cUrl选项? – Luis 2011-06-10 11:26:51
我不这么认为... – metaforce 2011-06-10 11:34:08