2016-11-14 91 views
0

“as.X”运算符通常将一种类型转换为另一种类型,但as.integer在应用于数组时失败。这是一个错误?这是Microsoft R Open 3.3的64位版本,也是R Foundation的R 3.3.1 for i686-pc-cygwin(32位)。R:为什么as.character将int matrix转换为char,但是as.integer不会将char matrix转换为int?

> m <- matrix(rnorm(25), 5) 
> m 
      [,1]  [,2]  [,3]  [,4]  [,5] 
[1,] -0.5958330 -0.3139274 -0.4746246 0.2431716 -0.5245235 
[2,] 0.5677058 0.1944457 -2.3786936 0.2516587 -0.3541963 
[3,] 0.6763564 -1.7285476 -0.5878008 -1.2277048 0.7737145 
[4,] -1.4607755 -0.4761012 1.0995414 0.6978072 0.6120277 
[5,] 0.8593707 0.2962030 1.1791963 -0.2276658 1.1559314 
> m[] <- as.integer(m) 
> m 
    [,1] [,2] [,3] [,4] [,5] 
[1,] 0 0 0 0 0 
[2,] 0 0 -2 0 0 
[3,] 0 -1 0 -1 0 
[4,] -1 0 1 0 0 
[5,] 0 0 1 0 1 
> m[] <- as.character(m) 
> m 
    [,1] [,2] [,3] [,4] [,5] 
[1,] "0" "0" "0" "0" "0" 
[2,] "0" "0" "-2" "0" "0" 
[3,] "0" "-1" "0" "-1" "0" 
[4,] "-1" "0" "1" "0" "0" 
[5,] "0" "0" "1" "0" "1" 
> m[] <- as.integer(m) 
> m 
    [,1] [,2] [,3] [,4] [,5] 
[1,] "0" "0" "0" "0" "0" 
[2,] "0" "0" "-2" "0" "0" 
[3,] "0" "-1" "0" "-1" "0" 
[4,] "-1" "0" "1" "0" "0" 
[5,] "0" "0" "1" "0" "1" 
+4

如果您分配给矩阵或向量的子集,矩阵/向量的类型只能更改为更高(更一般)的类型。 – Roland

+0

......特别是,'m [] < - as.integer(m)'按我的想法工作,我想。 – joran

+0

@joran:m [] < - as.integer(m)不能像我期望的那样工作。查看我已发布的代码。 –

回答

6

的文档状态:

当一个索引表达在赋值 的左侧出现(称为subassignment)则x的一部分被设置为 右手值任务的一面。在这种情况下,没有完成字符索引的部分 匹配,并且根据需要左侧的 被强制接受值。对于载体,答案将 层次结构中的原始< 逻辑<整数<双<复杂<字符<列表<表达是的类型x和值的较高。

您在左侧看到的行为与次级行为一致。

注意,即使as.integer“工作”时,直接应用于双矩阵这种情况下,它依然沿用了类型层次,只发:

> m <- matrix(rnorm(25), 5) 
> str(m) 
num [1:5, 1:5] 1.3807 -0.0858 1.4478 0.9509 0.6397 ... 
> typeof(m) 
[1] "double" 
> m[] <- as.integer(m) 
> str(m) 
num [1:5, 1:5] 1 0 1 0 0 0 0 0 -1 -1 ... 
> typeof(m) 
[1] "double" 

最后,as.integer往往不字符转换为有效整数:

> str(as.integer("a")) 
int NA 
Warning message: 
In str(as.integer("a")) : NAs introduced by coercion 

...但它导致的NA,即NA_integer_整数味道。但是,这将字符转换为整数,只要没有subassignment:

> str(as.integer("1")) 
int 1 

为了解决有关向量的评论,该记录的行为是在普通矢量是相同的:

> x <- rnorm(5) 
> x[] <- as.character(x) 
> x 
[1] "0.687551073804054" "-1.17843752343875" "0.144747745284427" "-0.931480738737143" "0.394279275668583" 
> x[] <- as.integer(x) 
> x 
[1] "0" "-1" "0" "0" "0" 
+0

我正要写出完全相同的答案,与文档中的引用相同! – nicola

+0

尝试x = as.character(1:9); X; as.integer(x) –

+0

该文档不适用于此。首先,文档是关于向量的,as.integer按照我期望的向量行事,将字符转换为整数。其次,它是关于隐含的强制,而不是关于明确的转换,这是整数应该做的。 –

3

如果你这样做要“向下转换”矩阵你可能在storage.mode()<-感兴趣:

> m <- matrix(1:4,2) 
> m 
    [,1] [,2] 
[1,] 1 3 
[2,] 2 4 
> storage.mode(m) <- "character" 
> m 
    [,1] [,2] 
[1,] "1" "3" 
[2,] "2" "4" 
> storage.mode(m) <- "integer" 
> m 
    [,1] [,2] 
[1,] 1 3 
[2,] 2 4 
0

Joran的答案给出了导致这种行为的规则。这条规则的原因是子分配有时会发生,有时不会在整个数据结构上运行。在这种情况下,它不能转换整个矢量或矩阵的数据类型。在m [] = ...的情况下,它可以,但最好在所有情况下以相同的方式运行。否则,在通过索引进行子分配恰好覆盖整个向量或矩阵的情况下,它会引入错误。