1
我有一个的大数据帧类似于过滤大量的ID从数据帧星火
+-----+------+------+
|ID |Cat |date |
+-----+------+------+
|12 | A |201602|
|14 | B |201601|
|19 | A |201608|
|12 | F |201605|
|11 | G |201603|
+-----+------+------+
的格式,我需要根据周围5000000 ID的列表来过滤行。直截了当的方式是过滤isin
,但这是非常糟糕的表现。这个过滤器如何完成?
,如果你可以通过一些手段划分您的数据,那么你应该能够更快地加入 –