这适用于Google App Engine,但不一定受此限制。摊销适用于App Engine的分配(和百分比)计算?
在Google App Engine上,数据库不是关系数据库,因此不能实现聚合函数(如总和,平均值等)。每一行都是相互独立的。为了计算总和和平均值,应用程序只需通过重新计算每个新写入到数据库的数据来分摊计算,以便它始终保持最新。
如何计算百分位数和频率分布(即密度)?我想绘制一个值域的密度图,这组值可能是数百万的数量级。循环遍历整个数据集可能是可行的(每个查询的限制是返回1000行),并基于此计算,但我宁愿采取一些智能方法。
是否有一些算法可以计算或近似密度/频率/百分比分布,可以计算一段时间?
顺便说一句,数据是不确定的,因为最大值和最小值可能是全部的地方。因此,分布将需要大约95%的数据,并且仅基于该数据做密度。
GAE限制了操作可能需要多长时间以及数据存储区CPU时间。一切都以http请求完成,因此每个请求只有很多数据可以通过。如果采用更简单的方法,将大型工作划分为多个操作并合并结果可能会遇到麻烦。 – 2009-05-25 23:17:51