我的数据有一个理想的范围,但进入过高或过低的区域。我希望能够将点数过高或过低的实例组合为单独的实例。 我做了一些假的数据在这里:按阈值对时间系列数据进行分组
library(dplyr)
library(ggplot2)
set.seed(123432)
dat <- data.frame(value = sample(20:600, 20, replace=F))%>%
mutate(ord = row_number(),
cat = ifelse(value > 350, "high",
ifelse(value < 90, "low", "good")),
extreme = ifelse(cat=="high" & value > lag(value) & value > lead(value), "Peak",
ifelse(cat=="low" & value < lag(value) & value < lead(value), "Trough", "")))
和在这里的图表:
ggplot(dat, aes(x = ord, y = value))+
geom_point()+
geom_line()+
geom_hline(yintercept = 300, color="blue")+
geom_hline(yintercept = 120, color="blue")+
coord_fixed(.025)
我知道如何组在Excel这些高&低的地区,但可以” t似乎复制它在R我想产生这样的东西(虽然E1将是“系列”):
通知列E基于列C &每个系列可能有多个峰值/谷值。
我希望这是明确的,你们乡亲们可以提供帮助。如果可能的话,我想坚持dplyr。
谢谢。
这是我不太清楚你真正想要的东西。剧情?一个单独的数据框?单独的数据框列?为我们定义“独立实例”。 –
我想要一个列添加到我的数据框,看起来像excel示例中的E列。每当“猫”变量发生变化时,它应该增加值。 – yake84