1
我试图在使用子进程的python脚本中执行unfluff,但结果总是空的。 如果我从shell执行它,它会好的。这里有一个例子:使用python子进程执行unfluff
从unfluff文档,我可以通过提取网页的内容:
curl -s 'http://observador.pt/2016/10/29/espanha-e-portugal-sao-unicos-paises-da-ue-sem-populismo-xenofobo-diz-antonio-costa' | unfluff
这导致在一个不错的JSON具有良好的内容提取。 现在,在Python我使用了以下内容:
import subprocess
url = 'http://observador.pt/2016/10/29/espanha-e-portugal-sao-unicos-paises-da-ue-sem-populismo-xenofobo-diz-antonio-costa'
p = subprocess.Popen(['curl','-s',url,'|','unfluff'],stdout=subprocess.PIPE)
print p.communicate()[0]
导致一个空字符串。 那么,我做错了什么?
谢谢。这几乎奏效。我现在得到了json,但空的领域。 – Miguel
您尝试了哪种解决方案?第一还是第二?你可以用'shell = True'加上'unfluff'上的第二个? –
好的,当第二个'unfluff'加入'shell = True'时它就起作用了。谢谢! – Miguel