我有一个csv文件,每行以(@)开头,行中的所有字段用(;)分隔。其中一个包含“Text”(“”[]“”)的字段有一些换行符,导致整个csv文件导致excel或访问时出现错误。换行符之后的文本被视为独立行,而不是遵循表的结构。删除csv文件中的换行符
@4627289301; Lima, Peru; 490; 835551022915420161; Sat Feb 25 18:04:22 +0000 2017; ""[OJO!
la premiacin de los #Oscar, nuestros amigos de @cinencuentro revisan las categoras.
+info: co/plHcfSIfn8]""; 0
@624974422; None; 114; 835551038581137416; Sat Feb 25 18:04:26 +0000 2017; ""[Porque nunca dejamos de amar]""; 0
使用python脚本的任何帮助?或任何其他解决方案...
作为输出我想有行:
@4627289301; Lima, Peru; 490; 835551022915420161; Sat Feb 25 18:04:22 +0000 2017; ""[OJO! la premiacin de los #Oscar, nuestros amigos de @cinencuentro revisan las categoras. +info: co/plHcfSIfn8]""; 0
@624974422; None; 114; 835551038581137416; Sat Feb 25 18:04:26 +0000 2017; ""[Porque nunca dejamos de amar]""; 0
任何帮助吗?我是一个csv文件(54MB),有很多带换行符的行...其他一些行也可以...
还有,@里面的评论是不是要考虑的呢? –
我想获得所有结构为示例第二行的行(@ 624914422 ...) – luisec
您是否尝试过任何操作?似乎有一个相当简单的方法来开始。逐行读取并放弃'@'并用';'分割或使用csv模块。 –