2016-02-24 37 views

回答

2

通过删除那些注释行来获得所需的输出。

re.sub(r'(?s)<!--.*?-->', '', html) 

实施例:

>>> html = '''<html> 
<head> 
<p>some code</p> 
<!-- 
<link href='www.xxx.com'> 
--> 
<head> 
<body> 
<p>some more code</p> 
</body></html>''' 
>>> print(re.sub(r'(?s)\s*<!--.*?-->', '', html)) 
<html> 
<head> 
<p>some code</p> 
<head> 
<body> 
<p>some more code</p> 
</body></html> 
+0

什么是''(S')? – Shafizadeh

+1

使您的正则表达式中的点符合换行符。 –

+0

你是怎么在没有在你的评论中写这个'@ Shafizade'而写我的用户名的? – Shafizadeh

相关问题