1
我创建一个df=dask.DataFrame.read_csv('s3://bucket/*.csv')
数据帧。当我执行一个df[df.a.isnull()].compute
操作时,我得到一组符合过滤标准的行。我想知道这些返回的行属于哪些文件,以便我可以调查为什么这些记录具有空值。该DataFrame
具有数十亿行和记录与遗漏值都在个位数。有没有一种有效的方式来做到这一点?如何映射`dask.DataFrame`的结果的CSV
作品,谢谢! –