我正在导入具有3列的CSV,其中一列可能有重复的记录。在CSV中查找重复的列值
我有2个检查事项:
1. The field 'NAME' is not null and is a string
2. The field 'ID' is unique
到目前为止,我解析CSV文件,一次检查1. (NAME is valid)
,而如果失败的话,它只是爆发while循环和停止的。
我想问的是,我怎么检查ID
是独一无二的?
我有这样的字段如下:
NAME, ID,
Bob, 1,
Tom, 2,
James, 1,
Terry, 3,
Joe, 4,
这将输出类似`重复的ID上线3'
感谢
PS这个CSV文件还有更多列,可以绕100,000条记录。我已经简化它的特殊原因,解决了重复的列/场
感谢
你插入到数据库? – user1844933
如何推送数组中的每个值并在每行检查“ID”值不在此数组中?那么如果是这样,只是'回声'xxx行上的错误“;' – Jerska
如果你在编码站点检查这个,可能会发生性能问题。我认为,更好的方法是检查数据输入级别并建立CSV状态。如果不关心性能问题,您可以检查您的ID是否已存在或不在您的数据库或程序端的存储位置。 –