2010-04-07 45 views
2

我无法弄清楚如何为一组记录设置估计的最高价格。如何为估计的最高价格设置过滤器

我想要避免的是简单地使用SQL MAX,因为可能有高昂的价格记录。

例如,在OLX的“计算机硬件”类别(http://www.olx.com/computers-hardware-cat-240)为最高价格过滤器estimately设置为$ 1400中,而是由价格排序,第一项是高于$ 10000

也许他们计算出的平均,然后估计一些最高价格...你觉得怎么样?

回答

3

如果假定在正常价格(高斯)分布,你可以最大使用这个公式

avg(price) + 3*stddev(price)

估计如果distribiution确实高斯约95%的样本应该包含在[avg - 3 * stddev; avg + 3 * stddev]

+0

有没有办法找到含有90%样本的最大值,而不是95%? 我这样问,因为如果有2或3过高的价格,估计的最大值将会太高... 我试图用2 *代替3 *,而且我认为它更接近我正在搜索的内容对于... – 2010-04-07 11:12:31

+0

3是正常的价值,你可以修改它以适应你的需求,就像我说的那样取决于样品的分布。显然,你可以手动删除异常值,但我猜这不是重点。 – pablochan 2010-04-07 11:43:30