我有一个任务在SAS服务器上运行K-Means集群算法,但运行内存不足。数据集是500G,我知道我可以对它进行抽样以适应内存,但是如果我想在整个数据上运行模型,Oracle R Enterprise(ORE)是否可以解决我的问题?关于铁矿石和ORCHOracle R Enterprise(ORE)KMeans包
其他相关问题:
- 是否甲骨文研究套餐包括任何聚类算法?是否有可用的Oracle R软件包列表?
- 如果我在Oracle R Enterprise中运行kmeans算法(R CRAN包),是否也会遇到内存问题?
- 在BDA中是否有任何可用于分布式Hadoop集群的R集群软件包?
感谢
无需支付Oracle。我会以每个核心10,000美元的低价格做到这一点! –
作为一个侧面说明,请托马斯Jungblut的帖子在K-意味着纯Hadoop实现 - http://codingwiththomas.blogspot.com/2011/05/k-means-clustering-with-mapreduce.html –
等待克里斯,这不是用于500G的生产使用,这会使他的情况更糟。请采取Mahout实施。 –