unsupervised-learning

0热度

1回答

例如，Kmeans聚类 - 它是作为神经网络算法实现的吗？

0热度

1回答

我对历史数据的分类变量执行了k模式聚类。我做了聚类，因为我想看看数据落入了什么样的簇。现在我有了输出，如果有新数据进来，有什么方法可以预测它会落入的群集。一种方法可能是，因为我有每行的数据和它所属的集群，我可以将它用作列车数据并进行监督式学习。但我想知道是否有任何可能的方法存在，我可以使用现有的输出变量来预测（半监督学习）我可能无法共享任何数据或输出，因为我工作一个客户，但如何处理的任何方向将

0热度

1回答

使用scala数据帧中的最小值和最大值来寻找正常值

我有一个39列的数据帧，每列都有不同的正常范围。通过使用正常范围，我想找出正常值，并把0否则把1. 这是我所做的，但我想为39列做。 val test :(Double => Double) = (value: Double) => { if(value >= 45 && value <= 62) 0 else 1 } 但我不明白如何使用不同的值到每一列。用于离：

1热度

2回答

相同数据和簇数的不同轮廓分数

我想使用轮廓分数为我的数据集选择最佳数量的簇。我的数据集是关于2,000多个品牌的信息，包括购买此品牌的客户数量，品牌的销售量以及品牌在各类别下销售的商品数量。由于我的数据集非常稀疏，因此我在集群之前使用了MaxAbsScaler和TruncatedSVD。我使用的聚类方法是k-means，因为我最熟悉这个（我会感谢你对其他聚类方法的建议）。当我将群集数量设置为80并运行k均值时，每次都得到

1热度

1回答

caffe中的基准对象 - 无监督网络

从准备咖啡网络数据的脚本中，下面的一段代码将图像（表示图像的numpy数组）转换为基准对象。 datum = caffe_pb2.Datum( channels=3, width=224, height=224, label=label, data=np.rollaxis(img, 2).tostring()) 如果网络监督的，你只是创

-1热度

2回答

R中的k模式集群返回不同的集群大小，每次运行

我正在使用K-Mode集群来对分类数据进行集群，但是当我用相同数量的集群聚集数据时，它每次都返回不同的集群大小我期待如果我使用相同的数据和相同数量的群集运行它，群集大小将始终是固定的我做错了什么？ library(klaR) mysample=read.csv("sample_to_cluster.csv") results1 <-kmodes(mysample[,2:ncol(mysam

0热度

1回答

根据以往观察到的分组排列最佳数据分组

帮我解决这个问题：我想弄清楚如何分组这些动物。比方说，你每天都会观察到一组动物像朋友一样闲逛。你想找出最好的方法来根据他们最喜欢的人自己分组。为了说明这一点，你观察：今天，你看到这些动物冷了起来： {大象老虎长颈鹿孔雀} 你看到这些第二天： {长颈鹿孔雀大象狮子猴} 然后第二天： {大象老虎鬣狗犀牛} 从这个所以，你可能会认为大象和TH e Tiger是好朋友，因为他们在两个不同的场合

0热度

1回答

ELKI：在运行k-means之前执行min-max规范化

我在我的Java项目中使用了ELKI提供的k-means实现之一。我想在实际运行k-means之前运行min-max规范化，但我不明白什么是使用库API来完成它的正确方法。有人能指引我正确的方向吗？

1热度

1回答

对于稀疏数据，训练LDA（潜在Dirichlet分配）并预测新文档的更快方法是什么？

关于训练LDA：当我们试图实现LDA，我们需要构建一个词 - 文档矩阵，但该矩阵是稀疏的数据，因为我们的令牌字典是非常大的（有的数百万字），并且一个文档有一小组令牌（〜1000 - 10000个字），因此在文档 - 文档矩阵中，它具有很多0值，并且需要更长时间来训练模型。那么我们怎样才能更快？关于预测新文件：训练后，现在我们有一个新的LDA模型，所以我们可以用它来预测哪些主题一个新的文件。但

1热度

1回答

聚类时间事件

我有一个关于使用点云的聚集来执行聚类的问题，其中一个维度 - 代表时间 - 有点受到保护。为了使超清晰，考虑这个视频用肉眼人们可以看到一些浓密云层飞来飞去像蚊子，它们可能代表几件事情进入和离开现场。现在假设我们有一个3维点（X，Y，时间）的数组，并应用一些天真的集群（比如DBSCAN）现在聚类相当不错，除了会议事件在考虑相同的群集，提出了X轨迹。现在，如果有不同的方式来处理第三个坐标，也许人