2013-09-26 112 views
0

我有一些刮擦数据的格式略有不同,但为了使它成为我需要删除括号内的任何东西,如果它们存在的话。我试图以各种方式使用钢带,但无济于事。删除一个字符串,如果它包含一个条目

一些示例数据:

Text (te) 
Text Text (tes) 
Text-Text (te) 
Text Text 
Text-Text (tes) 

我需要如何标准化后出现:

Text 
Text Text 
Text-Text 
Text Text 
Text-Text 

谁能给我提供了一个解决方案?由于SMNALLY

+0

你试过这个:s [:s.index('(')]',但它不是一个好的答案。 –

回答

5

假设括号不能嵌套,并且有每串最多一对,试试这个:

import re 
myString = re.sub(r'\(.*\)', '', myString) 

更具体的模式可能是:

myString = re.sub(r'\s*\(\w+\)\s*$', '', myString) 

以上模式将删除围绕括号表达式的空白,并且仅从行的末尾删除。

6
from re import sub 
x = sub("(?s)\(.*\)", "", x) 

这将删除括号(包括换行符)和括号本身之间的所有内容。

相关问题