power-law

    0热度

    1回答

    我有一个数据框,其中x-y值表示值及其计数,例如, (1,1000),(2,100),(3,10)等。我想用MLE来拟合这个分布的幂定律。 我可以使用power.law.fit或poweRlaw库,但看起来这些库取得了数据的特定样本,而不是表示值和它们的计数的x-y值。 有没有其他图书馆可以完成这项工作?谢谢!

    0热度

    1回答

    我想出了一个问题,在我的数据上拟合幂律曲线。我有两个数据集:bins1和曲线拟合使用numpy.linalg.lstsq bins2 bins1作用罚款(我然后使用np.exp(coefs[0])*x**coefs[1]得到幂律方程) 在另一方面,bins2是怪怪的并显示出一个糟糕的R平方 这两个数据有不同的方程比excel显示我(和更糟糕的R平方)。 这里是代码(和数据): import num

    1热度

    1回答

    我生成使用包rplcon()功能poweRlaw data <- rplcon(1000,10,2) 现在,我想知道哪些已知分布拟合数据的一些随机变量最好。 Lognorm? EXP?伽玛?幂律?指数截断的幂律? 于是我就用功能fitdist()封装fitdistrplus: fit.lnormdl <- fitdist(data,"lnorm") fit.gammadl <- fitdist(

    2热度

    1回答

    我装配幂定律到45个百万行矢量,为此,我使用幂律包中R:https://arxiv.org/pdf/1407.3492.pdf 该过程的计算量最大的部分是估计下界,它与完成的estimate_xmin()功能。这需要很多时间。 的代码是这样的(w是载体和c_pl来自“连续幂律”): c_pl <- conpl$new(w) est <- estimate_xmin(c_pl) c_pl$set

    2热度

    1回答

    我想用R来测试网络的度数分布是否像无幂性的幂律一样。尽管如此,我读过不同的人以许多不同的方式来做这件事,一个令人困惑的地方是模型中应该使用的输入。 例如,我读过Barabasi,建议将幂律适合度为(see Advanced Topic 3.B of chapter 4, figure 4.22的'补充累积分布'。但是,我见过的人适合幂律的度(随igraph::degree(g)获得),而我也看到其

    1热度

    1回答

    我有一个数据样本,样本大小约为500,000。目前我正在试图以适应幂律分布的样本中,R.使用poweRlaw包 所以这是我的代码实现这一目的: pl_rg <- conpl$new(a) estimate_xmin(pl_rg, xmax = 100) 但是,问题来了,当我尝试运行x<-estimate_xmin(pl_rg,xmax = 100)的代码。我发现这个代码非常耗时。现在我已经运

    2热度

    2回答

    我目前正试图找到一种方法来计算适用于MLE截断分布的幂定律。分布如下所示: 正如你所看到的,我能够适应整个分布(幂律配合),也下限(EXP-FIT)分开。我无法弄清楚的是如何拟合分布的上限(f.e.8 8 < x < 100)。 有没有办法用poweRlaw包或任何其他R包做到这一点?我所希望的是一些看起来像这样(注:这只是一个随机分布): 代码(如果需要): #Power-Law librar

    1热度

    1回答

    我的数据非常类似于power law分布。使用Python,我要通过在形式求解两个方程来近似数据: y是y轴数据。在Python中,它将是data[i]。 x将是i + 1。这表明我们在第一次数据索引,并在“随机”第二届一个别的地方数据得到两个方程有两个未知变量: 的问题归结为解决刚 由于数学的简化。我不知道如何使用类似numpy.linalg.solve这样的库来解决这样的等式。如何使用Pyth

    1热度

    1回答

    有指数截断功法下面的文章中的公式: 冈萨雷斯,M. C.,伊达尔戈,C. A.,& Barabasi,A. L.(2008)。了解个人移动模式。 Nature,453(7196),779-782。 这样的: 这是一个指数截断的幂律。有三个参数需要估计:rg0,beta和K.现在我们有几个用户的回转半径(rg),并将其上传到Github上:radius of gyrations.txt 以下代码可用

    0热度

    1回答

    我有一个有5列100万条记录的数据框。 unique_index,name,company_name,city_id,state_id 列,company_name,有100k个独特记录。这遵循权力法。 Top 5000 company_names覆盖了70%的记录。 我想取样品的人数相等这有助于数据的顶部5000,从剩余的一组公司。我试过pd.qcut(df['company_name'],