我有一个非常奇怪的问题。我有三个文件,其中包含一列数字。我只需要从第一个文件中获取唯一值,这些值不会出现在第二个和第三个文件中。两个文件比较
我试过的Python这样的:
for e in firstfile:
if e not in secondfile:
resultfile.append(e)
return resultfile
而同为第三档。
我试过的uniq,排序,DIFF,一些AWK脚本和通讯在Linux的shell喜欢这里:Fast way of finding lines in one file that are not in another?
但唯一的结果,每次我得到的是线条的相同数额,因为这是在以往的第一个文件。我一点都不明白!
也许,我错过了什么?也许这是一种格式?不过,我查了很多次。这里是文件:http://dropmefiles.com/BaKGj
P.S.后来我认为根本没有独特的线条,但我手动检查了它,第一个文件中的一些数字是唯一的。
P.P.S.文件的格式是这样的:
380500100000
380500100001
380500100002
380500100003
380500100004
380500100005
380500100008
380500100020
380500100022
380500100050
380500100070
380500100080
如果它只是一列数字,那么您应该包含20个来自eacg的数据,这样我们就可以了解您使用的数据。将这些文件放在Dropmefiles中将不会在将来7天内移除文件。我也会加载第一个文件,然后删除从第二个和第三个文件加载的所有内容(如果它存在于第一个文件中)。 – IvanD
当然,这是一个不错的音符。你是俄罗斯人吗? – tiredsys