2011-11-01 130 views
0

谁能帮我用下面的查询 什么是Python的方式来清洁以下字符串:蟒蛇阅读串

可以说我有这个词

"abcd 

'blahblah 

那么这个单词实际上是

abcd, blahblah 

我可以想到一个基本的方式..但实际上我正在阅读一个巨大的文本文件.. 和明确写一个代码来读取char字符似乎是矫枉过正,绝对不pythonic ..我相信有一个pythonic方式来做到这一点.. :) 谢谢

回答

2

您可以使用str.strip()方法从字符串的开头和结尾去掉不需要的字符。

>>> '"abcd'.strip('"\'') 
'abcd' 
>>> '\'blahblah'.strip('"\'') 
'blahblah' 
>>> print('"abcd'.strip('"\'')) 
abcd 
>>> print('\'blahblah'.strip('"\'')) 
blahblah 
+0

以及如何去除开始和结束时的单引号..?不应该出现像abcd而不是'abcd' – Fraz

+1

不,它只是在引号中,因为返回值本身就是一个字符串。如果您自己打印该值,则会看到该字符串中没有更多引号。为了证明这一点,我改变了答案。 – poke

1

看起来你只想从每个单词的字母字符。

import re 
_regex = r'\W+' #word characters only  

#read in input 
#split input on ' ' (space), to get words 

for word in list_of_words: 
    word = re.sub(_regex, '', word)