我的问题是:正则表达式从混乱的字符清洁CSV
我使用的一些软件就出来了一个csv,而问题是,这个软件是不是处理CSV如此出色的原因有一些字符串在他们中引用的csv以及包装字符串的内容也被引用,因此我会解析它。
所以这是正常的CSV:
"one","two","three"
,这里是我的情况:
"one","tw"o","three"
所以我有问题解析字符串像"tw"o"
。这基本上是输出文件的软件的问题,我无法编辑该软件。
所以我想我可以创建一个正则表达式,将采取不必要的引号或逗号,并确保每个字符串都包在引号中并用逗号分隔,有人知道我该如何实现它?
即时通讯使用的tototoshi库斯卡拉
是否有一个特定的原因,您为什么不使用Python的'csv'包来处理'.csv'文件? –
@WillemVanOnsem即时通讯使用tototoshi for scala,但这些库不能解析它,因为它不是一个正确的格式...如果它是“一个”,“两个”,“三个”没有问题,但它的“一个”,“tw” o“,”three“,所以图书馆不能解析它 – JohnBigs
为什么总是看正则表达式?即使你找到了这个东西,我*认为*看起来可能非常可怕。哎哟:你需要**其他**人甚至想一想,对于你来说,保持**这个正则表达式有多容易?意思是:有时候应该考虑坐下来写他自己的解析器,并明确地做事;而不是抛出怪物的正则表达式。 – GhostCat