2012-04-04 81 views
1

我有一个python脚本来处理一个文件夹中的几个文件时保存列表,结果是这样的,是有两列名为USER_AGENT和USER_TYPE处理多个文件蟒蛇

firefox, pc 
IE, pc 
iPhone, mobile 
.... 

自来自相同或不同文件的结果可能会被复制,我使用一个列表来跟踪唯一的组合。

if (user_agent,user_type) not in lookuplist: 
    lookuplist.append((user_agent,user_type)) 
    print user_agent,user_type 

现在的问题是,因为我有一个以上的原始数据文件来分析,如何“拯救” lookuplist当一个文件被完成,而第二个启动时,它仍然知道,例如(火狐,PC)已经存在,那么我不会有重复的结果

非常感谢

回答

0

首先,你应该使用set,而不是一个列表为您lookuplist。其次,打开循环内的所有文件并在循环中检查重复项。