我有一个现有相当大的SQL Server数据库和一个分析应用程序,它使用它来根据用户输入执行数据聚合。例如,应用程序可以可视化查询,如 select ... group by Col1, Col2, Col3, Col4, Col5
。用户然后可以切换列组,但是他们想要的,所以没有什么是静态的。Cassandra数据聚合
目前工作正常,但我们正在迅速获取更多数据,并且事情开始不起作用。
我们调查了Cassandra,并且出于多种原因想要朝那个方向移动,但不清楚如何允许用户以快速方式执行GROUP BY类型查询。
我们是否需要预先聚合所有数据组合?如果是这样,这听起来像我们可能需要x!
组合这个工作。这可能是相当多的预先计算工作。 Spark可能会有所帮助,但我怀疑这将在整个集群中快速下滑。
不是一个答案,但是这可能帮助:https://docs.datastax.com/en/latest-cql/ cql/cql_using/useCreateUDA.html –