我是基于列1和列表3比较2大型未排序.csv
文件的任务。 每个文件包含大约200k条记录。对于输出,我需要知道基于第1列和第3列的记录存在于第一个文件中,而不是第二个文件中。这些文件是用逗号分隔的值文件引用的。比较时,第3列需要忽略大小写。比较2列基于2列的大型未排序CSV文件
例File1中:
"id", "name", "email", "country"
"1233", "jake", "[email protected]", "USA"
"2345", "alison", "[email protected]", "Canada"
"3456", "jacob", "[email protected]", "USA"
"5678", "natalia", "[email protected]", "USA"
文件2
"id", "name", "email", "country"
"2345", "alison", "[email protected]", "Canada"
"3456", "jacob", "[email protected]", "USA"
"5690", "lina", "[email protected]", "Canada"
期望的输出文件
"5678", "natalia", "[email protected]", "USA"
代码示例将是非常赞赏。
哪种语言,看你到目前为止做了什么问题呢? – Mark
为什么“'1233”,“jake”,“[email protected]”,“USA”'行不出现在输出中? – brandizzi
嗨马克,我尝试了Java,使用HashMaps,它超级慢。 – Tanya