2016-09-14 109 views
1

我目前正在将数据框导出到excel电子表格中,但是我的一列长度各不相同的长字符串导致文件被损坏。Xlsx Writer被字符串损坏

with pd.ExcelWriter('thing.xlsx'.format(path), engine='xlsxwriter',options={'strings_to_urls': False}) as writer: 

这里我提出把它转换为Excel

df.to_excel(writer, 'long_text', index=False) 

编辑

当我删除它停止破坏数据框中该列,但我想保持的列。当我将字符限制为37个字符时,它也不再被破坏。这表明有一个字符在编码时遇到了麻烦。

任何想法如何处理?

+0

https://support.office.com/en-us/article/Excel-specifications-and-limits-16c69c74-3d6a-4aaf-ba35-e6eb276e8eaa列中只有255个字符可接受 – simar

+0

好吧,可能是为什么,我会尝试截断超过255个字符的字符看看是否可以解决这个问题 – Kalimantan

+0

@simar没有解决它。只有当我使它少于37个字符时,它才会消失,这使我认为问题是工作表中的特定字符。任何方式来编码这些,或处理这种类型的psossibilites? – Kalimantan

回答

1

为@jmcnamara说我的问题是,我的一个字符串在UTF-8编码没有,但是在编码全部串后的Excel文件不再被破坏

根据