2011-06-06 43 views
1

我试图实现类似的功能Facebook的缩略图预览。这个想法是,用户输入产品的URL,并选择该产品的最佳图像。使用python检测图像的大小使用python

为了滤除显然不是产品的图像,我想根据高度和宽度> 150px对其进行过滤。

我使用python和BeautifulSoup来下载HTML和提取图像,但无法找到一种方式来收集高度或宽度,当它在CSS中指定。

回答

0

GD是一直存在了相当一段时间库,它有一个非常简单的接口一起工作......这里有一个link to GD

看到“大小”的方法来获得宽度和高度。

编辑

啊,这个怎么样?

  1. 解析HTML内容和检索的URL CSS文件(S)和内嵌样式
  2. 下载CSS文件(S)和解析CSS文件,从而,构建规则集的CSS规则。
  3. 接下来,解析步骤1中HTML的其余部分,收集IMG标记,并且如果IMG标记具有class名称,请在CSS规则中查找类名称并检查widthheight

听起来有点复杂,但我敢打赌,下载一些CSS样式表要比下载图片轻得多,并且必须在服务器端使用图片库。

+0

谢谢马克。我希望找到一些不需要我下载和处理每张图片的东西,但我可能不得不解决。 – 2011-06-13 07:56:55