2017-09-10 76 views
0

我正在尝试从javascript提取数据。 JS貌似 -scrapy从javascript提取源代码url

<script type="text/javaScript"> 
var playerInstance = jwplayer("player"); 
playerInstance.setup({ 
    image: "http://cdn1.gomoviesgo.com/movies/1230451279-cover-Wonder-Woman.jpg", 
    sources: JSON.parse('[{"file":"http:\/\/stream.gomo.to\/home\/movies\/tt0451279.mp4","label":"720<sup>HD<\/sup>"}]'), 
    width: "100%" 
}); 
</script> 

我需要图像URL是http://cdn1.gomoviesgo.com/movies/1230451279-cover-Wonder-Woman.jpg和源地址是"http:\/\/stream.gomo.to\/home\/movies\/tt0451279.mp4"

请指导。

+0

什么是你的问题? – Siphalor

+0

我如何获得这些数据。无法实现代码。 –

+0

是你的蟒蛇吗?你是否将'javascript.js'作为一个纯文本文件存放在你的scrapper中? –

回答

0

您不能使用html解析器解析js,但可以使用正则表达式。可以使用内置的re方法。

image = response.css('script::text').re('image:\s*"(.*?)",')[0] 
file = response.css('script::text').re('"file":"(.*?)",')[0].replace('\\', '')