dbscan

    0热度

    1回答

    如果我在相似度矩阵上应用Scikit的DBSCAN(http://scikit-learn.org/stable/modules/generated/sklearn.cluster.DBSCAN.html),我会得到一系列标签。其中一些标签是-1。文件称他们为噪音样品。 这些是什么?他们都属于一个集群,还是他们都属于他们自己的集群,因为他们很吵? 谢谢

    0热度

    1回答

    我已经运行DBSCAN模型来聚类地理数据点,即纬度和纵向。要设置参数,我希望有一个视觉输入,以了解群集在地图中的外观。 我该如何做到这一点?此外,在不会崩溃我的电脑的形式。例如,使用gmaps绘制800 K点会显着减慢我的计算机速度。 谢谢!

    0热度

    1回答

    我想使用sklearn中的DBSCAN实现。它们允许您使用自定义距离度量标准,但只能使用一个eps值。 我想要的是以下内容: 可以说我的点每个都有3个特征,所以每个点都可以被认为是p=np.array([p1,p2,p3])形式的一个numpy数组。如果np.abs(p1-q1) < eps1和np.abs(p2-q2) < eps2和np.abs(p3-q3) < eps3两点p和q是邻居。通常

    1热度

    1回答

    我有一个关于使用点云的聚集来执行聚类的问题,其中一个维度 - 代表时间 - 有点受到保护。 为了使超清晰,考虑这个视频 用肉眼人们可以看到一些浓密云层飞来飞去像蚊子,它们可能代表几件事情进入和离开现场。现在假设我们有一个3维点(X,Y,时间)的数组,并应用一些天真的集群(比如DBSCAN) 现在聚类相当不错,除了会议事件在考虑相同的群集,提出了X轨迹。现在,如果有不同的方式来处理第三个坐标,也许人

    -1热度

    1回答

    所以我的任务是从.csv文件读取数据并形成群集。我的代码在一个小的.csv文件上工作正常,但是当我尝试阅读原始文件时,我必须处理它(它包含大约24k行)我的计算机挂起和磁盘使用100%拍摄,我有t0重新启动系统。我处于死胡同,不知道发生了什么。 DBSCAN代码与sklearn网站上提供的演示文件相同。然而读取我写的数据的代码 import csv import numpy as np imp

    -1热度

    2回答

    我想以此为榜样,我自己的一些数据:http://scikit-learn.org/stable/auto_examples/cluster/plot_dbscan.html#sphx-glr-auto-examples-cluster-plot-dbscan-py 我有麻烦搞清楚如何让我的“labels_true”变量作为DBSCAN预测评估的一部分。 这里是首先需要行吧: print("Homo

    0热度

    1回答

    我正在使用DBSCAN对数据集执行聚类。我认为这是因为在plt.plot()中传递给markerfacecolor的颜色参数不是单个值。请让我知道如果我在这里错了。我的功能是纬度,经度,speed_mph,speedlimit_mph,vehicle_id,driver_id。 这里是我的集群代码 dbsc = DBSCAN(eps = .5, min_samples = 5).fit(df_co

    1热度

    1回答

    下面 鉴于数据,我已经在那些点 set.seed(294056) df = data.frame(x = runif(1000), y = runif(1000), z = runif(1000)) library(dbscan) db = dbscan(df, eps = 0.3, minPts =100) # formed 1 cluster print(db) DBSCAN cl

    0热度

    2回答

    我有一大组诊断代码序列,我试图根据相似性进行聚类。我通过使用最小公共子序列算法计算相似性,然后从1中减去该相似性来找出每个序列之间的距离,从而创建了一个距离矩阵。 我然后通过了距离矩阵成sklearn的DBSCAN为这样: db = DBSCAN(eps=0.34, metric='precomputed') db.fit(sim_mat) 创建簇后,I输出中包含的每一个到一个文本文件的序列

    -1热度

    1回答

    我想用Gowalla的数据集簇位置。[这是我的数据包含用户ID(INT),检查时间(多项式),纬度(真),经度(真正),地点(INT) 我有这样的错误。 我的代码有什么问题? import csv import numpy as np from scipy.spatial import distance from sklearn.cluster import DBSCAN labels