我正在生成〜300k个数据点的散点图,并且存在问题,因为它在某些地方过于拥挤,导致没有结构可见 - 所以我有一个想法!绘制散点图最密集区域的轮廓
我想让该图为最密集的部分生成一个等值线图,并使用scatter()
数据点留下密度较小的区域。
所以我试图单独计算每个数据点的最近邻距离,然后当这个距离达到一个特定的值时,绘制一个轮廓并填充它,然后当它达到一个更大的值时)只是做分散...
我一直在尝试和失败了几天,我不知道传统的等高线图将在这种情况下工作。
我会提供代码,但它很杂乱,可能会混淆这个问题。它的计算密集程度如此之高,它可能会让我的电脑死机!
谢谢大家提前!
p.s.我一直在寻找和寻找答案!我相信它甚至不可能实现所有结果!
编辑:所以这个想法是看看哪些特定点位于300k样本的结构中。这是一个示例图,我的观点分散在三个差异中。颜色。
我将尝试从我的数据中随机采样1000个数据点并将其上传为文本文件。 干杯堆垛机。 :)
编辑:嘿, 这里有一些示例数据1000行 - 只有两列[X,Y]
(或[g-i,i]
从上图)空间分隔。谢谢你们! the data
根据如何拥挤这些值是,你很可能通过只是做'散射(X,Y,α-= 0.1)'或一些合适的小值逗一些结构出来。要做你的建议,我会建立一个核心密度估计(见'scipy.stats.kde')。 – chthonicdaemon
为什么不使用二维直方图来显示数据? –
@FriskyGrub您可以提供与您的实际数据具有相同类型/形状/等的随机数据 - 您并不总是需要首先发布生成真实数据的复杂步骤。使我们更容易提供对您有用的答案。 – YXD