2
我在做生物信息学,我们在mRNA上绘制小RNA。我们有每个mRNA上蛋白质的映射坐标,我们计算蛋白质结合mRNA的位置和被小RNA结合的位点之间的相对距离。通过高斯和scipy相加的曲线拟合
我获得以下数据集:
dist eff
-69 3
-68 2
-67 1
-66 1
-60 1
-59 1
-58 1
-57 2
-56 1
-55 1
-54 1
-52 1
-50 2
-48 3
-47 1
-46 3
-45 1
-43 1
0 1
1 2
2 12
3 18
4 18
5 13
6 9
7 7
8 5
9 3
10 1
13 2
14 3
15 2
16 2
17 2
18 2
19 2
20 2
21 3
22 1
24 1
25 1
26 1
28 2
31 1
38 1
40 2
当我绘制数据,我有3张图片:1在另一个大约3 -4 大约20和围绕-50最后一个。
我尝试三次样条插值,但它对我的数据不起作用。
我的想法是用高斯总和做曲线拟合。例如在我的情况下,在点5,20和-50估计3高斯曲线。
我该怎么做?
我看着scipy.optimize.curve_fit(),但我怎么能适应曲线精确intervalle? 如何添加曲线使其具有单一曲线?
'K-means'集群会为你工作吗? – Geoff
尽管Jaime的良好答案显示您的数据不太合适,请参阅[python中单独混合使用的高斯混合体](http://下的[PyMix] stackoverflow.com/questions/14189937/separate-mixture-of-gaussians-in-python)。 – denis