我试图创建一个算法,给定一组网站中的元素,它将返回更可能是描述产品的“一个”元素的算法。根据矩形大小对图像进行评分的算法
这当然不是一个100%准确的算法,并需要以人为本的选择之后,但我想获得至少3幅最可能的图像列表。这是我做的,到目前为止:
1 - 摆脱其平方大小比50x50px
2小 - 在页面
3计算所有的平均平方大小 - 给出分数每个取决于与平均平方尺寸的差异(平方尺寸越大,得分越高)
4 - 如果宽度>比(高度* 5),得分=得分* 0.5(我这样做是因为这可能是一个横幅这一页)。
这里是我想改变什么,但我看不出这将是这样做的一个很好的方式。在步骤3,我现在所做的权利赋予以下分数:
score_of_image = average_square_size - square_size_image
我想有将被共享出来给所有取决于它们的大小分的特定量。份额应该反映一张与其他图片相关的图片的大小。为了分享这些观点,什么是一个好的算法?
困惑!...你是在谈论一个简单的面积计算还是你在谈论图像的平方?我假设你是试图写一些蜘蛛类型算法来收集有关产品的网站信息,我会想到一个简单的面积计算d给出了“产品”形象的最佳标志。我不确定你为什么试图将它转换成分数? –
什么是“元素”?它是一个位图图像?什么是“方形尺寸”?是位图图像的尺寸(宽度乘以高度)?你的观点(4)有一些错误的语法,但它对我来说似乎是错误的...一个不错的方形图像的宽度>高度* 0.5,所以我不会惩罚它。如果宽度>高度* 2,我可能会惩罚图像,这是非常不同的。 –
我想在第3步中你想要一个百分比的差异。所以使用像'image_score = square_size_image/average_square_size'。因此,比平均值大的图像的分数大于1.0。 –