在python中有一点困难。我想带一个带有许多评论的.txt文件并将它分成一个列表。但是,我想分割所有标点符号,空格和\ n。当我运行下面的python代码时,它将我的文本文件分裂成多个奇怪的点。 注意:下面我只是试图在期间和期限上进行分割来测试它。但它仍然经常用文字去掉最后一封信。Python中的`re.split()`奇怪地工作
import regex as re
with open('G:/My Documents/AHRQUnstructuredComments2.txt','r') as infile:
nf = infile.read()
wList = re.split('. | \n, nf)
print(wList)
您忘记了正则表达式字符串的结束语。 –
看看这篇文章是否有帮助https://stackoverflow.com/questions/4998629/python-split-string-with-multiple-delimiters – Jake
我不知道为什么它在这段代码中做到了这一点,我把它放在我的ipynb文件中 –