2014-09-30 57 views
1

我有大量的治疗和对照组,我需要提供人口比例的比较。我正在寻找一种方法来循环访问每个类别提供测试的data.frame。两个比例的多重比较prop.test

样本数据:

test_data <- data.frame(
Category = c("A","A","B","B"), 
Churn = c(56,46,83,58), 
Other = c(180,555,144,86)) 

例如,比较类别A(56/180至五百五十五分之四十六)等等。

我的初始溶液:

by(test_data, test_data$Category, 
function(x) prop.test(test_data$Churn, test_data$Other)) 

的问题:该溶液由输出类别但提供了一个4样本测试,而不是一个双样品检验。我发现很多解决方案可以很好地遍历行,但不是很多的类。现在输出列表很好。

真的很感谢这个帮助!

+0

难道这有什么帮助吗? http://stats.stackexchange.com/questions/961/statistical-test-for-n-x-m-contingency-tables – nico 2014-09-30 15:02:28

回答

1

您的by()功能不正确。您没有使用传入的x值。通过使用原始变量名称(test_data),每个by()调用都没有数据是子集。尝试

by(test_data, test_data$Category, 
function(x) prop.test(x$Churn, x$Other))