2013-10-20 105 views
0

我假设你已经看到了这个问题的电影“社交网络”。下载“社交网络”中的图片

我想知道是否有可能从扎克伯格这样的网站上下载图片,但他在Facemash.com上工作的时候是这样做的;如果可能的话,你会如何去做这样的事情?

如果您有这方面的知识,请随时与我们联系;这是我一段时间以来一直很感兴趣的事情,我很想知道。

谢谢!

(所以相当多,下载图片来自网站的目录&文件,而不知道确切的名称,说文件)

回答

2

从网上抓取数据的通用技术被称为“scraping”。要下载图片,您可以抓取页面的源代码,搜索任何<img>标签,并对src属性指向的地址发出额外请求。然后,您将在页面中建立附加链接列表,以便重复此过程。

例如在这个页面上只有两个标签。其中之一是你的个性化头像,它看起来像这样:

<img src="http://i.stack.imgur.com/mWxgi.png?s=32&amp;g=1" alt=""> 

从一个Linux shell,我可以做抢用wget的图像:

wget "http://i.stack.imgur.com/mWxgi.png?s=32&amp;g=1" 

如何你抢的页面的不同而改变。在Python中,我可能使用requestsbeautiful soup库来获取和处理页面源代码。如果页面主要是通过Javascript生成的,我可能不得不使用Selenium Webdriver来实际驱动一个真正的浏览器会话。