power-law

0热度

1回答

我有一个数据框，其中x-y值表示值及其计数，例如，（1，1000），（2，100），（3，10）等。我想用MLE来拟合这个分布的幂定律。我可以使用power.law.fit或poweRlaw库，但看起来这些库取得了数据的特定样本，而不是表示值和它们的计数的x-y值。有没有其他图书馆可以完成这项工作？谢谢！

0热度

1回答

幂律曲线拟合scipy，numpy不工作

我想出了一个问题，在我的数据上拟合幂律曲线。我有两个数据集：bins1和曲线拟合使用numpy.linalg.lstsq bins2 bins1作用罚款（我然后使用np.exp(coefs[0])*x**coefs[1]得到幂律方程）在另一方面，bins2是怪怪的并显示出一个糟糕的R平方这两个数据有不同的方程比excel显示我（和更糟糕的R平方）。这里是代码（和数据）： import num

1热度

1回答

幂律（）`的`包功能fitdistrplus`

我生成使用包rplcon()功能poweRlaw data <- rplcon(1000,10,2) 现在，我想知道哪些已知分布拟合数据的一些随机变量最好。 Lognorm？ EXP？伽玛？幂律？指数截断的幂律？于是我就用功能fitdist()封装fitdistrplus： fit.lnormdl <- fitdist(data,"lnorm") fit.gammadl <- fitdist(

2热度

1回答

如何在R中使用poweRlaw包来处理非常大的数据集？

我装配幂定律到45个百万行矢量，为此，我使用幂律包中R：https://arxiv.org/pdf/1407.3492.pdf 该过程的计算量最大的部分是估计下界，它与完成的estimate_xmin()功能。这需要很多时间。的代码是这样的（w是载体和c_pl来自“连续幂律”）： c_pl <- conpl$new(w) est <- estimate_xmin(c_pl) c_pl$set

2热度

1回答

用于拟合网络度数分布的幂律的输入

我想用R来测试网络的度数分布是否像无幂性的幂律一样。尽管如此，我读过不同的人以许多不同的方式来做这件事，一个令人困惑的地方是模型中应该使用的输入。例如，我读过Barabasi，建议将幂律适合度为(see Advanced Topic 3.B of chapter 4, figure 4.22的'补充累积分布'。但是，我见过的人适合幂律的度（随igraph::degree(g)获得），而我也看到其

1热度

1回答

幂律分布拟合

我有一个数据样本，样本大小约为500,000。目前我正在试图以适应幂律分布的样本中，R.使用poweRlaw包所以这是我的代码实现这一目的： pl_rg <- conpl$new(a) estimate_xmin(pl_rg, xmax = 100) 但是，问题来了，当我尝试运行x<-estimate_xmin(pl_rg,xmax = 100)的代码。我发现这个代码非常耗时。现在我已经运

2热度

2回答

Power Law适用于poweRlaw包的临界分布

我目前正试图找到一种方法来计算适用于MLE截断分布的幂定律。分布如下所示：正如你所看到的，我能够适应整个分布（幂律配合），也下限（EXP-FIT）分开。我无法弄清楚的是如何拟合分布的上限（f.e.8 8 < x < 100）。有没有办法用poweRlaw包或任何其他R包做到这一点？我所希望的是一些看起来像这样（注：这只是一个随机分布）：代码（如果需要）： #Power-Law librar

1热度

1回答

在Python中解决幂律分布问题

我的数据非常类似于power law分布。使用Python，我要通过在形式求解两个方程来近似数据： y是y轴数据。在Python中，它将是data[i]。 x将是i + 1。这表明我们在第一次数据索引，并在“随机”第二届一个别的地方数据得到两个方程有两个未知变量：的问题归结为解决刚由于数学的简化。我不知道如何使用类似numpy.linalg.solve这样的库来解决这样的等式。如何使用Pyth

1热度

1回答

如何使用Python估计指数截断幂律的参数？

有指数截断功法下面的文章中的公式：冈萨雷斯，M. C.，伊达尔戈，C. A.，& Barabasi，A. L.（2008）。了解个人移动模式。 Nature，453（7196），779-782。这样的：这是一个指数截断的幂律。有三个参数需要估计：rg0，beta和K.现在我们有几个用户的回转半径（rg），并将其上传到Github上：radius of gyrations.txt 以下代码可用

0热度

1回答

熊猫：如何根据频率分布将遵循powerlaw的数据框的列分成两部分？

我有一个有5列100万条记录的数据框。 unique_index,name,company_name,city_id,state_id 列，company_name，有100k个独特记录。这遵循权力法。 Top 5000 company_names覆盖了70％的记录。我想取样品的人数相等这有助于数据的顶部5000，从剩余的一组公司。我试过pd.qcut(df['company_name'],