2012-03-22 108 views
0

我有一个逗号分隔的数据集。但是我的格式有点问题。我想要的一切是在形式X,X,X仅替换特定行上的逗号

下面是我的数据集的样本:

995970,16779453 
995971,16828069 
995972, 
995973,16828069 
995974,16827226 

正如你所看到的,我的大多数数据集是正确的格式,但我有那些单身份号码的逗号也(我的数据是在窗体ID#,连接#)。我将如何去除那些单身份证号码上的逗号?我似乎无法用文本编辑器弄清楚。有什么建议么?

编辑:我可以使用某种正则表达式来仅从具有指定长度的那些ID中移除它吗?

编辑2:好的我想出了使用一些正则表达式,感谢所有的帮助!

+0

上的数 “长度”?你的意思是什么?字符串长度?流浪的逗号造成了什么样的麻烦? – 2012-03-22 17:17:23

回答

0

在六人会做这样的事情

:%s/,$// 

这意味着

(进入行模式命令)

(上试该命令每行)

小号(替补)

,$

(空替换文本)

有时候,你需要像/, *$/(在一行的末尾匹配逗号)匹配一个逗号,后跟0个或多个尾随空格。你可以通过各种不同的方式在窗口上获得vi;一种方法是install Cygwin.

0

您可以在Notepad++中选择正则表达式模式,并使用以下正则表达式,$进行查找和替换。将替换字段留空。

0

随着sed命令:

sed 's/, *//' < FILE 

或就地(需要GNU SED):

sed -ie 's/, *//' FILE