2012-03-07 84 views
0

我有数据集概率优化

d<-data.frame(id=1:100, pr.a=runif(100,min=0, max=0.40)) 
d$pr.b=d$pr.a+runif(100,min=0, max=0.1)) 
d$pr.c=d$pr.b+runif(100,min=0, max=0.1) 

pr.a < pr.b < pr.c是一个二项式试验的试验A成功的概率,B,C对个人(ID的)

另外

cost.a<-80; cost.b=200; cost.c=600; 

试验A,B,C可在每个受试者被执行多次。例如,如果IDx的pr.a = 0.2,那么如果我进行这个测试2次,我认为成功概率为1-pbinom(0,2,0.2) = 0.36,代价为2*cost.a = 160

对于每个模态A,B ,C,在所有ID中,我想找到给定目标成功率所需成本的分布(可以说target=0.9

起初我想看看成本的分布,如果只有一个测试类型(仅A或仅C)应用于每个主题(尽管它可以在同一主题上多次执行)。

此外,我想找到如果组合的类型可以最小化目标成功率的成本。

这在我看来是一个优化问题。我没有经验优化。请有任何想法吗?

回答

1

我想你可以将其描述为优化问题,但只是一个非常简单的问题。您只是试图最大化每单位成本的概率。为了计算这个,只需成本将概率:

d$pr.a/cost.a # The probability per unit cost for A 
d$pr.b/cost.b 
d$pr.c/cost.c 

选择每个ID的最大,你会得到每个ID“最好”的测试。要计算给定概率的预期成本,只需将target除以probability并乘以cost即可。

target=0.9 
(target/d$pr.ca) * cost