我假设你已经看到了这个问题的电影“社交网络”。下载“社交网络”中的图片
我想知道是否有可能从扎克伯格这样的网站上下载图片,但他在Facemash.com上工作的时候是这样做的;如果可能的话,你会如何去做这样的事情?
如果您有这方面的知识,请随时与我们联系;这是我一段时间以来一直很感兴趣的事情,我很想知道。
谢谢!
(所以相当多,下载图片来自网站的目录&文件,而不知道确切的名称,说文件)
我假设你已经看到了这个问题的电影“社交网络”。下载“社交网络”中的图片
我想知道是否有可能从扎克伯格这样的网站上下载图片,但他在Facemash.com上工作的时候是这样做的;如果可能的话,你会如何去做这样的事情?
如果您有这方面的知识,请随时与我们联系;这是我一段时间以来一直很感兴趣的事情,我很想知道。
谢谢!
(所以相当多,下载图片来自网站的目录&文件,而不知道确切的名称,说文件)
从网上抓取数据的通用技术被称为“scraping”。要下载图片,您可以抓取页面的源代码,搜索任何<img>
标签,并对src
属性指向的地址发出额外请求。然后,您将在页面中建立附加链接列表,以便重复此过程。
例如在这个页面上只有两个标签。其中之一是你的个性化头像,它看起来像这样:
<img src="http://i.stack.imgur.com/mWxgi.png?s=32&g=1" alt="">
从一个Linux shell,我可以做抢用wget的图像:
wget "http://i.stack.imgur.com/mWxgi.png?s=32&g=1"
如何你抢的页面的不同而改变。在Python中,我可能使用requests和beautiful soup库来获取和处理页面源代码。如果页面主要是通过Javascript生成的,我可能不得不使用Selenium Webdriver来实际驱动一个真正的浏览器会话。