2012-04-22 42 views
-1

我被要求为非技术性的观众提供关于聚类算法的讲座。考虑到这一点,我想做一个简单的练习,我将要求观众从数据集中识别组。但是,我无法找到可用于此目的的好数据集。用于聚类算法的数据集

是否有客户和他们购买的一些产品的数据集,我可以用于此目的?或者任何其他可能看起来合适的数据集!

回答

0

我可以建议一个简单的地理位置数据库,例如德国的所有城市。我想你可以免费找到它。或者你可以寻找美国宇航局的天空数据。集群太好了。

0

这里是包含4个月交易的塔丰数据集。从Chun Nan教授那里得到它。它现在存储在我的保管箱文件夹中:https://www.dropbox.com/s/tsd5zd8a7afmzs7/D11-02.ZIP?dl=0每个文件的第一行显示中文列名。英文是: 日期;会员卡ID;产品分类;产品代码;数量;总交易金额(单位:TWD)