2014-02-12 23 views
1

我正在使用Java程序来提取一些数据点,并计划使用scipy来确定相关系数。我计划将数据提取到csv样式的文件中。我应该如何格式化每个相应的数据集,以便我可以轻松地将其读入scipy为相关性确定打包数据的最佳格式?

回答

1

每个数据集都是一列,所有数据集合起来就可以生成CSV。它通过numpy.genfromtxt()读取为2D array,然后调用numpy.corrcoef()来获得相关系数。

注意:您还应该考虑相同的数据布局,但使用pandas。通过pandas.read_csv()将CSV读入dataframe,并通过.corr()

+0

获得相关系数谢谢。我想进一步挑战你。如果我有多组数据,我该如何分解它?我可以将“Subject1”,“Subject2”等插入到我的csv文件中。 –

相关问题