如何使用其概率函数最好地模拟任意单变量随机变量？

在R中，如果只有概率密度函数可用，模拟任意单变量随机变量的最佳方法是什么？如何使用其概率函数最好地模拟任意单变量随机变量？

2009-10-20 andrekos

真棒的问题！ – 2009-10-20 12:19:34

这里是一个（慢）实施反cdf方法，当你只有一个密度。

den<-dnorm #replace with your own density 

#calculates the cdf by numerical integration 
cdf<-function(x) integrate(den,-Inf,x)[[1]] 

#inverts the cdf 
inverse.cdf<-function(x,cdf,starting.value=0){ 
lower.found<-FALSE 
lower<-starting.value 
while(!lower.found){ 
    if(cdf(lower)>=(x-.000001)) 
    lower<-lower-(lower-starting.value)^2-1 
    else 
    lower.found<-TRUE 
} 
upper.found<-FALSE 
upper<-starting.value 
while(!upper.found){ 
    if(cdf(upper)<=(x+.000001)) 
    upper<-upper+(upper-starting.value)^2+1 
    else 
    upper.found<-TRUE 
} 
uniroot(function(y) cdf(y)-x,c(lower,upper))$root 
} 

#generates 1000 random variables of distribution 'den' 
vars<-apply(matrix(runif(1000)),1,function(x) inverse.cdf(x,cdf)) 
hist(vars)

来源

2009-10-20 15:53:52

使用累积分布函数http://en.wikipedia.org/wiki/Cumulative_distribution_function

就用它的倒数。检查这里更好的画面http://en.wikipedia.org/wiki/Normal_distribution

这意味着：从这里选择随机数[0,1]，并设置为CDF，然后检查值

它也被称为位数功能。

来源

2009-10-20 12:22:22

-1

您可以使用大都会黑社会从密度中获取样本。

来源

2009-10-20 14:15:24

为了澄清上述 “使用大都市黑斯廷斯” 的答案：

假设ddist()是您的概率密度函数

类似：

n <- 10000 
cand.sd <- 0.1 
init <- 0 
vals <- numeric(n) 
vals[1] <- init 
oldprob <- 0 
for (i in 2:n) { 
    newval <- rnorm(1,mean=vals[i-1],sd=cand.sd) 
    newprob <- ddist(newval) 
    if (runif(1)<newprob/oldprob) { 
     vals[i] <- newval 
    } else vals[i] <- vals[i-1] 
    oldprob <- newprob 
}

注：

完全未经测试
效率取决于候选分布（即，值为cand.sd）。为了获得最大的效率，调cand.sd至25-40％的录取率
结果将是自相关的...（虽然我猜你总是可以 sample()结果，以争夺他们，或薄）
可能需要丢弃的“烙印”，如果你的初始值是怪异

的经典方法这个问题是拒绝采样（例如见Press等人数值方法）

来源

2009-10-24 18:56:37

如何使用其概率函数最好地模拟任意单变量随机变量？

回答

相关问题