2016-02-05 53 views
0

我正在阅读一个csv文件,其中包含371行文本。Python2.7/NLTK在某些字符前删除字符串的一部分

0þ“文本包括数字和引号”þ4.6

我试图提取TH“和”号的短信。我怎样才能做到这一点?文件data.csv中的每一行的

+0

使用开始ň结束 –

+0

能否请你解释一下? – boneless

+1

http://stackoverflow.com/questions/3368969/find-string-between-two-substrings –

回答

0

谢谢大家!

无论你的回答帮我找到了解决方案:

test = sent[(sent.index('þ"')):(sent.index('"þ'))] 
+0

如果有字符串,就不会工作“”þ“' – alvas

0
awk -F'þ"|"þ' '{print $2}' data.csv 

上述命令打印第2列,
其中列由或者是þ"分离。