我遇到一个问题,阅读使用熊猫分页标签分离文件。阅读与Python熊猫分页标签文件
所有的单元格值都有双引号,但对于某些行,还有一个额外的双引号可以打破整个过程。例如:
Column A Column B Column C
"foo1" "121654" "unit"
"foo2" "1214" "unit"
"foo3" "15884""
我得到的错误是:错误标记数据。答案:C:应符合8355 31场,只见58
我使用的代码是:
csv = pd.read_csv(file, sep='\t', lineterminator='\n', names=None)
并能正常工作的文件的其余部分,但不是在那里这些额外的双引号出现的那些。
但您的输入数据已损坏。修复创建buggy文件的代码不是更简单吗? –
你是对的,除了这个数据来自我们的客户之一。有没有解决方案来读取这个特定的文件? –
只有在行尾或任何地方才会遇到双引号? –