我需要在我的数据集中创建一个新变量,该变量考虑了在线评论的过帐顺序。创建产品ID的变量'订单'会计
该数据集包含来自亚马逊的特定产品的在线评论(由其ASIN号标识)以及相应的Unix时间戳。到目前为止,我已经能够通过ASIN对产品进行分类,并在此范围内通过时间戳。现在我想用这样的发布顺序创建列:
I need the posting order to start from 1 every time that ASIN changes
如何做到这一点在Excel或R任何想法?
非常感谢!
我需要在我的数据集中创建一个新变量,该变量考虑了在线评论的过帐顺序。创建产品ID的变量'订单'会计
该数据集包含来自亚马逊的特定产品的在线评论(由其ASIN号标识)以及相应的Unix时间戳。到目前为止,我已经能够通过ASIN对产品进行分类,并在此范围内通过时间戳。现在我想用这样的发布顺序创建列:
I need the posting order to start from 1 every time that ASIN changes
如何做到这一点在Excel或R任何想法?
非常感谢!
在R
,我们可以使用ave
从base R
,以创建由组( “ASIN”)的序列。
df1$PostingOrder <- with(df1, ave(seq_along(ASIN), ASIN, FUN= seq_along))
较短,紧凑的办法是
library(splitstackshape)
getanID(df1, "ASIN")[]
在Excel中,随着工作表的布局,在E列中使用以下公式(并填充)。
=IF(B2<>B1,1,E1+1)
谢谢OldUgly!我修改了一点你的公式,因为第一行(E2)必须默认为1,然后'= IF(B3 <> B2,1,E2 + 1)'放在E3中(并填充下来)。这完美解决。非常感谢!! – JorgeF
真棒!谢谢!! – JorgeF