2010-08-06 25 views
0

这是我在python中的代码,它生成链接对象的列表。我想删除重复的形式。如何删除在Python中使用mechnize生成的链接中的重复项?

cb = list() 
for link in br.links(url_regex="inquiry-results.jsp"): 
     cb.append(link) 
print set(cb) 

但它返回错误unhashable instancelink是这样的 -

Link(
    base_url='http://casesearch.courts.state.md.us/inquiry/inquirySearch.jis', 
    url='/inquiry/inquiry-results.jsp?action=..........', 
    text='12', 
    tag='a', 
    attrs=[('href', '/inquiry/inquiry-results.jsp?action=.......'), 
    ('title', 'Go to page 12')] 
    ), 

[新增只是为了方便换行和点]

如何删除重复?

回答

3

您可以构造一个字典使用URL作为键和得到其值:

cb = {} 
for link in br.links(url_regex="inquiry-results.jsp"): 
    cb[link.url] = link 
print cb.values()