2012-12-28 52 views
0

有没有人在Ubuntu中使用过cedergren数据集。我有问题下载它,因为我有Ubuntu操作系统。它基本上用于logistic回归Cedergren数据集在Ubuntu下载

http://nlp.stanford.edu/~manning/courses/ling289/cedegren-varbrul.html

将使用GLM FUNC,看看它是如何工作的这个数据集

任何帮助表示赞赏!

+0

你的问题是什么?看起来您将不得不在WINE下运行Windows版本,如参考页面所示。 ('apt-get install wine') –

+0

@BenBolker我认为这将用于安装goldvarb软件,我只想读取数据cedergren并在R中使用它(基本上想要应用glm func) – getitstarted

+0

明白了: http://www.cloudstat.org/index.php?do=/attachment/download/id_95/ – getitstarted

回答

0
> require(utils) 
> inp <- read.fwf(file=url("http://www-nlp.stanford.edu/~manning/courses/ling236/handouts/panama-mac.tok"), 
       widths=rep(1, 5), colClasses=c("NULL", rep("factor",4))) 
> str(inp) 
'data.frame': 8955 obs. of 4 variables: 
$ V2: Factor w/ 3 levels "0","1","L": 2 2 2 2 2 2 2 2 2 2 ... 
$ V3: Factor w/ 6 levels "a","A","d","m",..: 4 4 4 4 4 4 4 4 4 4 ... 
$ V4: Factor w/ 4 levels "C","P","S","V": 1 1 1 1 1 1 1 1 1 1 ... 
$ V5: Factor w/ 5 levels "1","2","3","4",..: 1 1 1 1 1 1 1 1 1 1 ... 

如果需要的话,使这个更自我记录您可以重命名这些列和供应标签的因素,但由于是可运行的GLM数据集。