unsupervised-learning

    0热度

    1回答

    例如,Kmeans聚类 - 它是作为神经网络算法实现的吗?

    0热度

    1回答

    我对历史数据的分类变量执行了k模式聚类。我做了聚类,因为我想看看数据落入了什么样的簇。现在我有了输出,如果有新数据进来,有什么方法可以预测它会落入的群集。 一种方法可能是,因为我有每行的数据和它所属的集群,我可以将它用作列车数据并进行监督式学习。但我想知道是否有任何可能的方法存在,我可以使用现有的输出变量来预测(半监督学习) 我可能无法共享任何数据或输出,因为我工作一个客户,但如何处理的任何方向将

    0热度

    1回答

    我有一个39列的数据帧,每列都有不同的正常范围。 通过使用正常范围,我想找出正常值,并把0否则把1. 这是我所做的,但我想为39列做。 val test :(Double => Double) = (value: Double) => { if(value >= 45 && value <= 62) 0 else 1 } 但我不明白如何使用不同的值到每一列。 用于离:

    1热度

    2回答

    我想使用轮廓分数为我的数据集选择最佳数量的簇。我的数据集是关于2,000多个品牌的信息,包括购买此品牌的客户数量,品牌的销售量以及品牌在各类别下销售的商品数量。 由于我的数据集非常稀疏,因此我在集群之前使用了MaxAbsScaler和TruncatedSVD。 我使用的聚类方法是k-means,因为我最熟悉这个(我会感谢你对其他聚类方法的建议)。 当我将群集数量设置为80并运行k均值时,每次都得到

    1热度

    1回答

    从准备咖啡网络数据的脚本中,下面的一段代码将图像(表示图像的numpy数组)转换为基准对象。 datum = caffe_pb2.Datum( channels=3, width=224, height=224, label=label, data=np.rollaxis(img, 2).tostring()) 如果网络监督的,你只是创

    -1热度

    2回答

    我正在使用K-Mode集群来对分类数据进行集群,但是当我用相同数量的集群聚集数据时,它每次都返回不同的集群大小 我期待如果我使用相同的数据和相同数量的群集运行它,群集大小将始终是固定的 我做错了什么? library(klaR) mysample=read.csv("sample_to_cluster.csv") results1 <-kmodes(mysample[,2:ncol(mysam

    0热度

    1回答

    帮我解决这个问题: 我想弄清楚如何分组这些动物。 比方说,你每天都会观察到一组动物像朋友一样闲逛。 你想找出最好的方法来根据他们最喜欢的人自己分组。 为了说明这一点,你观察: 今天,你看到这些动物冷了起来: {大象老虎长颈鹿孔雀} 你看到这些第二天: {长颈鹿孔雀大象狮子猴} 然后第二天: {大象老虎鬣狗犀牛} 从这个 所以,你可能会认为大象和TH e Tiger是好朋友,因为他们在两个不同的场合

    0热度

    1回答

    我在我的Java项目中使用了ELKI提供的k-means实现之一。 我想在实际运行k-means之前运行min-max规范化,但我不明白什么是使用库API来完成它的正确方法。 有人能指引我正确的方向吗?

    1热度

    1回答

    关于训练LDA: 当我们试图实现LDA,我们需要构建一个词 - 文档矩阵,但该矩阵是稀疏的数据,因为我们的令牌字典是非常大的(有的数百万字),并且一个文档有一小组令牌(〜1000 - 10000个字),因此在文档 - 文档矩阵中,它具有很多0值,并且需要更长时间来训练模型。那么我们怎样才能更快? 关于预测新文件: 训练后,现在我们有一个新的LDA模型,所以我们可以用它来预测哪些主题一个新的文件。但

    1热度

    1回答

    我有一个关于使用点云的聚集来执行聚类的问题,其中一个维度 - 代表时间 - 有点受到保护。 为了使超清晰,考虑这个视频 用肉眼人们可以看到一些浓密云层飞来飞去像蚊子,它们可能代表几件事情进入和离开现场。现在假设我们有一个3维点(X,Y,时间)的数组,并应用一些天真的集群(比如DBSCAN) 现在聚类相当不错,除了会议事件在考虑相同的群集,提出了X轨迹。现在,如果有不同的方式来处理第三个坐标,也许人