1
我在使用Python中的lxml解析JS时遇到了问题。当我执行下面的代码,我的输出是:使用lxml在python中解析html和js
“在0x10cec4e10 <元素DIV>”
from lxml.html.clean import Cleaner
cleaner = Cleaner()
cleaner.javascript = True
text = urllib2.urlopen("URL").read().decode("utf-8")
test = lxml.html.fromstring(cleaner.clean_html(text))
print test
我想要得到的是没有JS的东西解析的文本。有人可以点亮一些光线吗?谢谢。