2016-04-08 33 views
0

我需要在我的数据集中创建一个新变量,该变量考虑了在线评论的过帐顺序。创建产品ID的变量'订单'会计

该数据集包含来自亚马逊的特定产品的在线评论(由其ASIN号标识)以及相应的Unix时间戳。到目前为止,我已经能够通过ASIN对产品进行分类,并在此范围内通过时间戳。现在我想用这样的发布顺序创建列:

I need the posting order to start from 1 every time that ASIN changes

如何做到这一点在Excel或R任何想法?

非常感谢!

回答

0

R,我们可以使用avebase R,以创建由组( “ASIN”)的序列。

df1$PostingOrder <- with(df1, ave(seq_along(ASIN), ASIN, FUN= seq_along)) 

较短,紧凑的办法是

library(splitstackshape) 
getanID(df1, "ASIN")[] 
+1

真棒!谢谢!! – JorgeF

0

在Excel中,随着工作表的布局,在E列中使用以下公式(并填充)。

=IF(B2<>B1,1,E1+1) 
+0

谢谢OldUgly!我修改了一点你的公式,因为第一行(E2)必须默认为1,然后'= IF(B3 <> B2,1,E2 + 1)'放在E3中(并填充下来)。这完美解决。非常感谢!! – JorgeF