2013-06-11 27 views
11

输入Fisher检验错误:LDSTP太小

NN <- c(359,32);JJ <- c(108,13);NNS <- c(103,15);VBN <- c(95,9);RB <- c(63,11);NNP <- c(56,0);VBG <- c(55,10);IN <- c(38,16);VB <- c(20,10);CD <- c(17,6);CC <- c(11,6);DT <- c(11,4);MD <- c(8,5);PRP4 <- c(8,1);PRP <- c(7,4);FW <- c(5,1);VBD <- c(5,3);RBR <- c(4,0);VBP <- c(4,1);VBZ <- c(4,3);WRB <- c(4,2);EX <- c(3,1);NNPS <- c(2,0);WDT <- c(2,3);WP <- c(2,1);PDT <- c(1,1);POS <- c(1,0);RBS <- c(1,0);TO <- c(1,1);UH <- c(0,1) 
Finaltable <- 
cbind(NN,JJ,NNS,VBN,RB,NNP,VBG,IN,VB,CD,CC,DT,MD,PRP4,PRP,FW,VBD,RBR,VBP,VBZ,WRB,EX,NNPS,WDT,WP,PDT,POS,RBS,TO,UH) 
rownames(Finaltable) <- c("tag1","tag2") 
Finaltable 

chisq.test(Finaltable) 


fisher.test(Finaltable) 

输出

fisher.test(Finaltable) : FEXACT error 7. 
LDSTP is too small for this problem. 
Try increasing the size of the workspace. 

我该如何解决这个问题,而modifyng的原始数据。对于这种比较是否有任何非参数测试?

回答

19

您可以尝试增加workspace参数的默认值,但我不知道您是否能够使其足够大(我放弃了workspace=2e8,但仍然失败;我用完了内存位于workspace=2e9)。您也可以尝试模拟p值,例如例如fisher.test(Finaltable,simulate.p.value=TRUE,B=1e7)(但是),但由于p值非常小,因此如果您想要对p值进行多次绑定,那么您将需要大量的模拟(B),这也会非常缓慢。 (对于大多数的目的,知道p<1e-7是绰绰有余的 - 但在某些生物信息学的情况下,人们希望使用p作为信号强度的指标和/或施加大量的多重校正比较。这些方法,但他们在那里...)