我有一个数据集,其中包含特定位置(支架)上区段的初始位置和最终位置,如果在同一个支架中有一些segmens与其他区域重叠。R:使用R找到重叠区域
> head(jobs)
JOB_N Genome Scaffold loc_i loc_f
1 PRJNA179522 Contig10285 1251 1502
1 PRJNA179522 Contig10285 1251 1602
2 PRJNA179522 Contig10285 1255 1499
2 PRJNA179522 Contig10285 828 1076
2 PRJNA179522 Contig783 245 1487
2 PRJNA179522 Contig783 822 1073
我想要两件事:第一个是找到所有单个脚手架中的所有重叠区域。 第二个是获得一个新表,其中只包含每个“新”段的第一个和最后一个位置。输出将是:
JOB_N Genome Scaffold loc_i loc_f
1 PRJNA179522 Contig10285 1251 1602
2 PRJNA179522 Contig10285 828 1076
2 PRJNA179522 Contig783 245 1487
在此先感谢。
参见'foverlaps'在'data.table'或'findOverlaps'在'IRanges' – MichaelChirico