我有一个输入字符串,其分隔符为$$$Field$$$
。该字符串有一些行。我需要返回字符串中所有项目的列表,仅由$$$Field$$$
分隔。熊猫:在read_csv中忽略新行作为分隔符
在下面的例子中,我应该收到输出['Food', 'Fried\nChicken', 'Banana']
。然而,似乎它也将新行解释为分隔符,所以不是列表,而是获取表格。我怎么能忽略这些新的线,以便我回来一个列表?
import pandas as pd
from pandas.compat import StringIO
temp=u"""Food$$$Field$$$Fried
Chicken$$$Field$$$Banana"""
df = pd.read_csv(StringIO(temp), sep='\$\$\$Field\$\$\$',engine='python')
print (df)
唯一的原因,为什么我用熊猫是因为这个字符串实际上是一个巨大的.csv文件,我不能在同一时间阅读这一切都在内存中,但流处理是可以接受的。
除去不需要'\ N'使用'温度= “”。加入输入本身,(temp.split (“\ n”))' – ZdaR
我们希望保留所有的\ n,但作为字符串的一部分,如示例中的“Fried \ nChicken”。 – Arturo
你想要的DataFrame是什么样的?新行字符是表格文件的默认行分隔符,因此需要有一种方法来区分它是否是行分隔符或保存在字符串中。 DataFrame应该看起来像'['Food','Fried \ nChicken','Banana']'。我们不想使用行分隔符,所有新行应保存在字符串中 – victor