我有两个由bp间隔组成的表,Table1具有较大的间隔,第二个表具有较短的间隔(仅2bp)。我想创建一个只包含Table 1范围的新表,它们的“大”范围至少包含一个表2的元素。如果表2中没有与表1范围对应的元素,则不应包含表1中的该范围。包含另一个表中至少一个元素的表的子集
在表1(df
)的本实施例中的行2(1, 600, 1500
)应不包括:
df <- "Chromosome start end
1 1 450
1 600 1500
2 3500 3585
2 7850 10000"
df <- read.table(text=df, header=T)
表2(df2
)
df2 <- "Chromosome start end
1 5 6
1 598 599
2 3580 3581
2 7851 7852
2 7859 7860"
df2 <- read.table(text=df2, header=T)
newtable的(dfout
):
dfout <- "Chromosome start end
1 1 450
2 3500 3585
2 7850 10000"
dfout <- read.table(text=df2, header=T)
您的具体问题是什么?请参阅http://stackoverflow.com/help/how-to-ask您可能需要澄清如何包含或不包含项目的逻辑。这也有助于说出“bp”的含义。 – GreenGiant