如何从两个列表中删除公共元素？

我有两个列表，如下面的例子（实际上，a更长），我想删除所有常见元素，在这种情况下，列表punctuation中给出的标点符号。如何从两个列表中删除公共元素？

a = [['A', 'man,', 'view,', 'becomes', 'mankind', ';', 'mankind', 'member', 'comical', 'family', 'Intelligences', '.'],['Jeans', 'lengthen', 'legs', ',', 'hug', 'hips', ',', 'turn', 'heads', '.']] 
punctuation = ['(', ')', '?', ':', ';', ',', '.', '!', '/', '"', "'"]

来源

2015-05-04 William Jungerman

＃2是一个社区，在这里您发布一些代码或东西，你有试过，到目前为止你尝试过什么？我们很乐意提供帮助，但您有什么尝试？ –

你可以这样做：

>>> from itertools import chain 
>>> filter(lambda e: e not in punctuation, chain(*a)) 
['A', 'man,', 'view,', 'becomes', 'mankind', 'mankind', 'member', 'comical', 'family', 'Intelligences', 'Jeans', 'lengthen', 'legs', 'hug', 'hips', 'turn', 'heads']

或者，如果你想保持你的子表结构：

>>> [filter(lambda e: e not in punctuation, sub) for sub in a] 
[['A', 'man,', 'view,', 'becomes', 'mankind', 'mankind', 'member', 'comical', 'family', 'Intelligences'], ['Jeans', 'lengthen', 'legs', 'hug', 'hips', 'turn', 'heads']]

来源

2015-05-04 21:25:12 dawg

当顺序并不重要：

你可以在上面做一个set()操作，但是首先你要压平嵌套列表a（从Making a flat list out of list of lists in Python拍摄）：

b = [item for sublist in a for item in sublist] 
cleaned = list(set(b) - set(punctuation))

cleaned是一个看起来像['A', 'hug', 'heads', 'family', 'Intelligences', 'becomes', 'Jeans', 'lengthen', 'member', 'turn', 'mankind', 'view,', 'legs', 'man,', 'hips', 'comical']

当顺序很重要：

简单罗列理解，这可能是比较慢

cleaned = [x for x in b if x not in punctuation]

cleaned看起来像['A', 'man,', 'view,', 'becomes', 'mankind', 'mankind', 'member', 'comical', 'family', 'Intelligences', 'Jeans', 'lengthen', 'legs', 'hug', 'hips', 'turn', 'heads']

来源

2015-05-04 21:10:56 MERose

你可以做到这一点，但列表顺序可能会改变。

[list(set(sublist)-set(punctuation)) for sublist in a]

使用集合，您可以删除标点条目，并将结果再次转换为列表。使用列表理解为列表中的每个子列表执行此操作。

如果保持的顺序是非常重要的，你可以这样做：

[[x for x in sublist if not (x in punctuation)] for sublist in a]

来源

2015-05-04 21:13:41 Bastian35022

让一组词移除和测试遏制逐项的，如果你需要维持秩序。

cleaned = [word for word in words if word not in blacklist]

来源

2015-05-04 21:20:16 jwilner

如何从两个列表中删除公共元素？

回答

相关问题