2011-07-07 133 views
2

我每天有零至多次预订,而且我需要衡量这些预订在整个我的时间段内的分布情况。预订可以是半天或全天预订。均匀性测试的快速算法

我在这种情况下考虑的时间段为一个月。

我的数据有很大的差距:在一个月内,我可能只有高达25-50%的预订天数。

我需要一个算法,它会给我一个数字(任意单位,我不在乎:我只是比较许多排列和选择最均匀的),它代表预订的一致性。

最重要的是,我需要它非常快,因为我将运行它数百次。

我已经看过安德森 - 达林测试,克拉默-CON-米塞斯和柯尔莫哥洛夫 - 斯米尔诺夫测试,但是这些所有检查数据是否符合任何分布。我确信有一个更快的算法来确定数据是否完全一致。

我编码在C#

+0

如果您只关心“统一”的相对顺序,您可以找到预订之间的差距的RMS。一个真正的均匀分布应该具有最低的RMS(假设在固定时间内固定数量的预订)。 – bdares

回答

1

我希望我不是非常简单化你的问题,但我相信你真正想知道的是你的差距的variance。有一个set of algorithms计算方差,每个都有自己的属性,所有这些都很快。

+0

是的,这是我目前使用的方法。我希望有一种算法使用一些数学属性,这使得我们可以快速移动数据点,以计算单个循环中的间隙和差异。 – Ozzah