2017-09-06 84 views
-1

我有一列csv和一堆引号。我想将它读入熊猫系列,以便csv中的每一行都是一个条目。但是,当我使用pd.read_csv时,读者在发现逗号时切断了该行。读取CSV与熊猫并忽略逗号

如何忽略逗号并将excel中的整个单元格读入一系列对象中?

数据如下:一列和很多行。一行一行如下:“赫克托尔去卫生间,他很紧张,因为他以前从未去过那里”,所以我的程序由于后面的逗号而“紧张”地切断了句子。

+0

使用'sep'参数来定义一个分隔符是不是默认'',' –

+0

使用sep关键字。设置sep ='|'或者其他东西 – flyingmeatball

+0

因此,'sep'将单元格中的项目分隔到列中,但是对于新行,它将使用excel中的新行,对吗? – Landmaster

回答

1

您有一个文本文件,每行一个条目。因此,你可以通过设置delimiter='\n'加载文件,并给你一个列名:

import pandas as pd 

data = pd.read_csv('input.txt', delimiter='\n', names=['text']) 
print(data['text'][0]) 

还会送:

Hector went to the bathroom. He was nervous, as he'd never been there before