2016-03-03 32 views
-1

当使用numpy.histogram时,如果density = True,该函数将返回一个数组,其中每个点都有pdf值。但是我的问题是,它是否会返回垃圾箱前端或垃圾箱中间的pdf值?Numpy直方图,哪一点是密度?

例如,如果我有垃圾桶0-1,1-2,2-3等......它会给我的点数0,1,2等......或在0.5,1.5, 2.5等...

谢谢!

回答

0

每个归一化的直方图值将给出您的样本在其相应的边缘边界所跨越的范围内的估计概率密度。如果您有垃圾箱边缘ab那么相应的归一化直方图值将是区间[a,b)上的概率密度。

直观地说,要根据某些有限数量的样本估计密度,可以计算落入每个直方图箱的采样数,然后除以箱的面积。对于无限多的样本和无限小的箱子,这最终会聚合在基础连续分布的PDF上。

+0

对,我明白了。但是,至于哪个“更有意义”,在我看来,如果我试图用这些箱密度来逼近pdf,那么我将假设作为一个点,这个密度被定义在箱右边的中间? 也感谢您的答案。 –

+0

您的密度估计对于属于同一个分档的所有*分是不变的 - 它不仅仅是一个点估计。一般情况下,你可能会认为它接近于靠近桶中心的点的真实概率密度(尽管我认为在这种情况不成立的情况下也可以构造反例)。您可能还想查看[密度估算]的其他方法(https://en.wikipedia.org/wiki/Density_estimation),例如[KDE](https://en.wikipedia.org/wiki/Kernel_density_estimation) 。 –

+0

对,感谢您的帮助,我很感激。 –