pearson-correlation

    1热度

    1回答

    我的问题是如何关联我的两个binned图并输出Pearson相关系数? 我不知道如何正确提取np.corrcoef函数所需的合并数组。这里是我的脚本: import numpy as np import matplotlib.pyplot as plt A = np.genfromtxt('data1.txt') x1 = A[:,1] y1 = A[:,2] B=np.genfro

    2热度

    1回答

    我正在使用推荐系统。这将是一个Android应用程序,用户将在其中输入他们的偏好,并在这些偏好的基础上,向该用户显示其他匹配的简档。我从用户那里获取数据并将其存储在Firebase中。 这些是数值和为了显示匹配的简档与该用户,我使用用于计算用户之间的相似性计数两种算法:Cosine similarity和Pearson correlation 我撷取算法的名称从应用程序,然后执行算法,以显示相似的

    3热度

    2回答

    我有2个矢量A和B,每个长度为10,000。对于ind=1:10000中的每一个,我想要计算A(1:ind)和B(1:ind)的Pearson相关性。当我在for循环中执行此操作时,需要太多时间。在我的机器中,parfor不能与超过2名工人一起工作。有没有办法快速执行此操作并将结果保存在向量C中(显然其长度为10,000,第一个元素为NaN)?我发现Fast rolling correlation

    0热度

    1回答

    随着时间的推移,我有数百个种群(不同物种,地点等)的相关性。我如何统计分析所有这些相关性(各自的组)? 我有p值,配置文件,相关系数为每600 +相关,但我怎么能比较这些组内(物种,位置等)。 我试图在数据相关人口数(百分比)和年份,物种和位置(变成虚拟变量)上进行大的部分相关性作为控制因素,当家庭内部以及与位置相关时(作为虚拟变量)作为一个控制变量时关联物种内,但我不知道这是否正确。 下面是一些

    1热度

    1回答

    试图在一个矩阵来计算特定基因(这里其基因1)与所有其它(35999个候选)的相关性 samp1 samp2 samp3 samp4 Gene 1 3.7891 2.4487 1.1939 0.6013 Gene 2 1.4484 3.2316 2.841 1.9545 Gene 3 0.4505 2.6062 2.0729 0.6403 . . Gene 36000 1.8828

    0热度

    1回答

    我对统计数据很感兴趣,并深入了解最佳方式以及如何根据天气数据分析性能数据。 我的假设是性能数据受天气数据影响,我想证明这一点。 我试图在散点图上绘制日常性能数据& meantemp数据做回归分析,看起来很奇怪。我认为这是由于天气数据的负面价值。 下面是所有可用给我的天气信息: 雾,雨,雪,冰雹,雷电,龙卷风,meantempm,meantempi,meandewptm,meandewpti,mea

    0热度

    1回答

    我正在尝试获取前一周的输入的相关值到下一周的输出。 为了这个例子我已经设置了它,每周的输入是下一周的输出,df.corr()应该给出1.000000的结果。 我原来的数据是这样的:在这里上传 Date Input Output 1/1/2010 73 73 1/7/2010 2 73 1/13/2010 3 2 1/19/2010 4 3 全样本数据: https

    6热度

    1回答

    我有一个CSV文件,其中包含项目的特征值:每行都是一个三元组(id_item,id_feature,value),表示特定项目的特定功能的值。数据非常稀少。 我需要计算两个项目的距离矩阵,一个使用Pearson相关度量,另一个使用Jaccard索引。 目前,我实现了一个内存解决方案,我做这样的事情: import numpy as np from numpy import genfromtxt

    0热度

    1回答

    我想检查熊猫数据框中多个列之间相关性和相关性的显着性。 用下面的数据帧,我已经构建了以下相关表: ARI Flesch Kincaid time VIX_close FEDFUNDS -2.090000 NaN -3.400000 2016-02-04 20.239333 0.345333 16.060272 38.489788 14.355616 2016-02-04 20.239

    2热度

    1回答

    我想从数据框(df)获取列名并将它们关联到由spearmanr相关函数生成的结果数组。我需要将列名(a-j)与相关值(spearman)和p值(spearman_pvalue)关联起来。有没有一种直观的方式来执行此任务? from scipy.stats import pearsonr,spearmanr import numpy as np import pandas as pd df=