所以我总共具有这4周不同的cols在一个数据帧分组列到计数中的R数据帧
port ip service numberOfTimes
1 22 11.11.79.100 ssh 16
2 80 11.11.79.100 www 19
3 111 11.13.79.110 ipw 21
4 123 11.13.79.110 ssh 50
5 22 64.50.80.140 cde 45
6 80 64.50.80.140 www 16
7 22 71.11.64.100 ssh 234
8 80 71.11.64.100 you 33
9 22 100.15.31.1 ssh 99
10 41 120.15.31.12 has 19
因此,我有以下问题:
,使用R为以下是否有可能组这样它可以成为类似的东西?
后
port ip(count of same ip) service numberOfTimes
22 4 ssh 399 (#1+#5+#7+#9)
80 3 www 68 (#2+#6+#8)
等等等等的端口
您已经标记了'dplyr',因此我假设您已经遇到过'group_by()'和'summarize()'函数。你有没有试图自己解决这个问题?你写了什么代码,到底发生了什么? – MrFlick
嗨@MrFlick说实话。我被困住了,真的被困住了。 我想尝试dt <- dt%>%group_by(port,service)%>%summarize(numberOfTimes = sum(numberOfTimes))但它没有工作。有错误无法修改分组变量。但是,再次,即使我将它们汇总在一起,链接到每一行的IP地址会发生什么情况?我真的很担心如何开始。因为每排感觉都像是依赖于另一个 – user127886