2013-04-10 29 views
5

我的目标是近似二项式变量总和的分布。 我使用Ken Butler和Michael Stephens的以下论文The Distribution of a Sum of Binomial Random Variables近似R中二项式随机变量之和的分布

我想写一个R脚本来找到皮尔逊近似的二项式和。 有一个R包PearsonDS,允许以一种简单的方式做到这一点。

所以我拿这篇论文的第一个例子,试图找到这种情况下皮尔逊分布的密度。 最后,我收到一条错误消息“这些时刻没有概率分布”。

请问你能解释我下面的代码有什么问题吗?

library(PearsonDS) 

#定义参数五二个随机变量下

n<-rep(5,5) 
p<-seq(0.02,0.10,0.02) 

#找到前四个累积

k.1<-sum(n*p) 
k.2<-sum(n*p*(1-p)) 
k.3<-sum(n*p*(1-p)*(1-2*p)) 
k.4<-sum(n*p*(1-p)*(1-6*p*(1-p))) 

#发现偏度和峰度参数

beta.1<-k.3^2/k.2^3 
beta.2<-k.4/k.2^2 

#定义时刻和计算

moments <- c(mean=k.1,variance=k.2,skewness=sqrt(beta.1),kurtosis=beta.2) 
dpearson(1:7,moments=moments) 

我收到错误消息“这些时刻没有概率分布”。

+0

从文档中我不清楚'dpearson'如何用'moments'覆盖时决定分布类型。如果您知道您想使用哪种发行版,请尝试直接使用所需的'dpearson [I thru VII]'函数。或者,确保你所有的“时刻”论点都是合法的,例如方差> 0和真实。 – 2013-04-10 15:45:23

+0

@Carl,谢谢你的回应。 我仔细阅读了文档。 – 2013-04-10 20:07:21

+0

函数'pearsonFitM'确定分布类型。当峰度减1小于偏度时,显示“这些时刻没有概率分布”的消息。 不幸的是,我不知道,也找不到这种情况的原因。如果我放弃它,则累积量定义PearsonI分布。 – 2013-04-10 20:38:11

回答

2

你试图插入在你的瞬间的峰度,实际上是超峰度,这只是kurtosis - 3。从dpearson()帮助页:

时刻:均值,方差,偏度,峰度(没有超额峰度)的
可选矢量/列表。

因此增加3 beta.2将为您提供真正的峰度:

beta.1 <- (k.3^2)/(k.2^3) 
beta.2 <- k.4/(k.2^2) 
kurt <- beta.2 + 3 

moments <- c(mean = k.1, variance = k.2, skewness = beta.1, kurtosis = kurt) 
dpearson(1:7, moments=moments) 
# [1] 0.3438773545 0.2788412385 0.1295129534 0.0411140817 0.0099279576 
# [6] 0.0019551512 0.0003294087 

为了得到像在纸张上的结果,我们应该调查的累积分布函数,并添加0.5校正

ppearson(1:7+0.5, moments = moments) 
# [1] 0.5348017 0.8104394 0.9430092 0.9865434 0.9973715 0.9995578 0.9999339 

一点背景信息:引起由连续近似一个离散分布的偏置

由于峰度和偏度之间的关系不是无效的,因此该函数产生错误:峰度由以下方式偏斜度较低:kurtosis >= (skewness)^2 - 1。证明并不漂亮,当然超出了问题的范围,但如果您喜欢这种不平等的不同版本,可以查看下面的参考资料。

  1. Wilkins,J.Ernest。关于偏度与峰度的一个注记。安。数学。中央集权。 15(1944),no。3,333--335。 http://projecteuclid.org/euclid.aoms/1177731243
  2. K.Pearson。数学对进化论的贡献,XIX;第二个补充回忆录偏斜变异。 PHILOS。跨。罗伊。 SOC。伦敦Ser。 A,216(1916),p。 432 http://rsta.royalsocietypublishing.org/content/216/538-548/429
  3. Pearson,K.(1929)。 “编者注意到”频率函数矩和各种统计常数的不等式“。 Biometrika。 21(1-4):361-375。 link
+0

这些数字似乎与表3中皮尔逊近似的数字不匹配。您可以对此进行评论吗? – bdeonovic 2017-07-05 15:07:52