我有一个中等大小的制表符分隔的.txt文件 - 大约40k行。当我导入到Openrefine时,第406行将所有其余内容(整个40,000行)放入该行第13列中的单个单元格中。将制表符分隔的文本文件导入到openrefine
我试过grep-serching两个不同的文本编辑器(Sublime Text 2 & TextWrangler)中的看不见的东西,看起来应该是这样。
我用Excel转换为CSV也试过了,实际工作,但是:
- 这是一个不雅的解决方法,
- 它具有变音符号麻烦,
- 我不吨要花更多的时间在Excel中解决它
我试着除了在任何一方的10行违规行,并引发同样的问题。
Here are those 21 lines,直接从TextWrangler复制。 (我可以从终端输出复制,如果这有什么区别)。
任何帮助,一如既往,非常感谢!
你是对的 - 当我从文件复制粘贴到帖子窗口时,标签被翻译成空格。 这里是一个链接到该文件:http://mvabl.com/mvabl.com/public/data_excerpt.txt 再次,这是“违规”行+ 10线在任何一方。所以坏行是#11 我明白@ Ettore的建议,但他们并不实际适用。 – SteveS
@SteveS对不起,当我点击链接时,我收到一个“URL Not Find”。 –
对不起。我有mvabl.com两次。这应该工作: http://mvabl.com/public/data_excerpt.txt – SteveS