1
我查询的序列:与正则表达式序列词语
NUNCA [ADV + NEG + CIRC]MÁS[ADV +补偿+ CIRC]compraré[V + H_PREDICAT_ACTION]
和
NUNCA更多酒店compraré
我的脚本:
corpus = "Me[Unknown] temo[Unknown] que[Unknown] buscare[Unknown]
otras[Unknown] opciones[Unknown] esta[Unknown] nunca[ADV+NEG+CIRC]
más[ADV+comp+PADV+H_CIRCONSTANT_QUANTITE] compraré[V+H_PREDICAT_ACTION]"
part1 = re.findall(r"(\w+)\[ADV\+NEG.*?\]", corpus)
part2 = re.findall(r"(\w+)\[ADV+comp+PADV.*?\]", corpus)
part3 = re.findall(r"(\w+)\[V\+H_PREDICAT.*?\]", corpus)
print(part1 + part2 + part3)
结果:
[]
@pitanga,你也可以检查我的're.findall'方法 – RomanPerekhrest
非常感谢!我可以利用并问你一些其他问题吗?如果序列不在字符串的末尾,我怎么能找到它? – pitanga
@pitanga,那就是我的're.findall'方法 – RomanPerekhrest