1
我正在使用Java程序来提取一些数据点,并计划使用scipy
来确定相关系数。我计划将数据提取到csv样式的文件中。我应该如何格式化每个相应的数据集,以便我可以轻松地将其读入scipy
?为相关性确定打包数据的最佳格式?
我正在使用Java程序来提取一些数据点,并计划使用scipy
来确定相关系数。我计划将数据提取到csv样式的文件中。我应该如何格式化每个相应的数据集,以便我可以轻松地将其读入scipy
?为相关性确定打包数据的最佳格式?
每个数据集都是一列,所有数据集合起来就可以生成CSV。它通过numpy.genfromtxt()
读取为2D array
,然后调用numpy.corrcoef()
来获得相关系数。
注意:您还应该考虑相同的数据布局,但使用pandas
。通过pandas.read_csv()
将CSV读入dataframe
,并通过.corr()
获得相关系数谢谢。我想进一步挑战你。如果我有多组数据,我该如何分解它?我可以将“Subject1”,“Subject2”等插入到我的csv文件中。 –