Python2.7/NLTK在某些字符前删除字符串的一部分

我正在阅读一个csv文件，其中包含371行文本。Python2.7/NLTK在某些字符前删除字符串的一部分

0þ“文本包括数字和引号”þ4.6

我试图提取TH“和”号的短信。我怎样才能做到这一点？文件data.csv中的每一行的

2016-02-05 boneless

使用开始ň结束 –

能否请你解释一下？ – boneless

http://stackoverflow.com/questions/3368969/find-string-between-two-substrings –

谢谢大家！

无论你的回答帮我找到了解决方案：

test = sent[(sent.index('þ"')):(sent.index('"þ'))]

2016-02-05 19:04:03 boneless

如果有字符串，就不会工作“”þ“' – alvas

awk -F'þ"|"þ' '{print $2}' data.csv

上述命令打印第2列，
其中列由或者是þ"或"þ分离。

2016-02-05 18:37:01 TheCodeArtist

回答